Organização de arquivos de dados
- Separe os arquivos de pesquisa de seus arquivos pessoais – não os mantenha juntos.
- Use pastas – agrupe arquivos dentro de pastas.
- Siga os procedimentos recomendados – verifique se há diretrizes estabelecidas em sua equipe ou departamento.
- Adote descrições padronizadas e detalhadas. Caso use siglas, lembre-se de fornecer, junto aos dados, uma lista de siglas e seus significados.
- Nomeie pastas apropriadamente – de acordo com o Nome do Projeto, ou seu Nome, tópicos, etc.
- Seja consistente – ao desenvolver um esquema de nomeação para suas pastas, fique com ele.
- Mantenha os dados protegidos por senha – utilize senhas difíceis de serem decifradas e atualize periodicamente.
- Arquivos ativos e arquivos antigos – tente manter em locais separados.
- Controle o versionamento – utilize sequências numéricas ou datas: DD-MM-YYYY
- Mantenha Backups – assegure-se de manter cópias em seu computador, USB e nuvem.
Melhores formatos para preservação
- Dados textuais: XML, TXT, HTML, PDF, Open Office
- Dados tabulares (incluindo planilhas): CSV
- Bancos de dados: XML, CSV
- Imagens: TIFF, PNG
- Áudio: FLAC, WAV, MP3
- Compressed: ZIP
- README files: TXT
Organize sua Documentação de Dados
A documentação de dados é o suporte à compreensão pois reúne as informações que acompanham dados para fornecer contexto, explicação ou instruções sobre os dados, avisos de confidencialidade, permissões de uso ou reutilização de dados. A documentação de dados serve para que outras pessoas e o próprio autor compreendam o que são seus dados. Confira cinco práticas para documentar dados:
- Cite a fonte dos seus dados
- Defina seus dados usando um dicionário de dados
- Descreva todo o pacote de dados usando uma especificação de dados ou arquivo leia-me
- Rastreie a linhagem de dados para visualizar seu pipeline de processamento de dados
- Capture o ambiente reproduzível e o fluxo de trabalho de todas as alterações feitas nos seus dados
A documentação de suporte pode incluir:
- Citação: As citações de dados devem incluir, no mínimo:
- Criador(es) ou contribuidor(es)
- Data da publicação
- Título do conjunto de dados
- Editor
- Identificador (por exemplo, Handle, ARK, DOI) ou URL da fonte
- Versão, quando apropriado
- Data de acesso, quando apropriado
- Dicionário de dados
- Leia-me – especificação de dados
- Coisas a incluir em sua especificação de dados:
- Título
- Criador(es), sua afiliação e informações de contato
- Acesso e compartilhamento
- Instruções de acesso
- Licenças e termos de uso
- Software necessário para usar ou compreender os dados
- Coisas a incluir em sua especificação de dados:
- Relatórios e publicações finais de projetos
- Cadernos de laboratório
- Questionários ou guias de entrevista
- Metadados: Title, Description, Creator, Funder, Keywords, Affiliation
Itens e conjuntos de dados compartilhados devem ser comunicados adequadamente para garantir transparência, clareza, compreensão, replicabilidade e facilidade de uso.
Recomendação geral: siga os Princípios F.A.I.R. (do inglês – Findable, Accessible, Interoperable, and Reusable), qualidades que garantem que os dados são Encontráveis, Acessíveis, Interoperáveis e Reutilizáveis.