Repositórios Europeus: estado atual e desafios Relatório 2023

A Ciência Aberta está inaugurando um novo paradigma para a pesquisa; um em que todos os pesquisadores têm acesso sem precedentes ao corpus completo de pesquisa para análise, mineração de texto e dados, e outros novos métodos de pesquisa. Um pré-requisito para alcançar essa visão é uma rede forte e funcional de repositórios que fornece acesso humano e mecânico à ampla gama de resultados de pesquisas.

Exigirá a transição de repositórios de serviços institucionais isolados rumo à visão na qual os repositórios fazem parte de uma infraestrutura distribuída e globalmente conectada para a comunicação científica, além de quais camadas de serviços de valor agregado podem ser implantadas.

Em janeiro de 2023, OpenAIRE, LIBER, SPARC Europe e COAR lançaram uma parceria estratégia destinada a reforçar a rede europeia de repositórios. Por meio desta estratégia, essas organizações estão  empenhadas em trabalhar em conjunto – e com outras organizações – para desenvolver e executar um plano que irá controlar,  reforçar e melhorar os repositórios na Europa.

Como primeiro passo, um levantamento do panorama dos repositórios europeus foi realizado em fevereiro-março de 2023. Esta é uma tradução livre de alguns destaques do Relatório e seus resultados [1]

A pesquisa teve 394 respostas de repositórios em 34 países. Verificou-se que, coletivamente, os repositórios europeus adquirem, preservam e fornecem acesso aberto a dezenas ou possivelmente centenas de milhões de resultados de pesquisa valiosos e representam infraestruturas críticas sem fins lucrativos no panorama europeu da ciência aberta.

Eles são usados para compartilhar artigos que podem ser pagos em revistas publicadas, mas também para proporcionar o acesso a uma grande variedade de outros tipos de resultados de pesquisa, incluindo: dados de pesquisa, teses/dissertações, artigos de conferência, preprints, código, e assim por diante.

Uma grande proporção dos repositórios está baseada em universidades, tornando-os bastante sustentáveis e, ao que tudo indica, suas coleções estão sendo bem aproveitadas pela comunidade de pesquisa e além. O número e a amplitude de valor agregado dos serviços para os quais os repositórios contribuem demonstra que os repositórios têm progredido em direção à visão da próxima geração de repositórios, que consiste em ir além do repositório como um serviço institucional, ao repositório em rede que é parte integrante do ecossistema mais amplo.

Além disso, os repositórios estão bem posicionados para apoiar a expansão das práticas de ciência aberta em toda a Europa e a reforma da avaliação da pesquisa, que coloca uma maior ênfase na inclusão, diversidade e transparência. No entanto, para alcançar plenamente essa visão, ainda há trabalho a ser feito. A pesquisa expôs uma série de áreas importantes onde o cenário atual dos repositórios poderiam ser fortalecidos. Em particular, descobrimos que os repositórios lutam com três principais desafios:

(1) manter plataformas de software atualizadas e altamente funcionais,
(2) aplicar boas práticas coerentes e abrangentes em termos de metadados, preservação e estatísticas de uso; e
(3) ganhar visibilidade adequada no ecossistema acadêmico.

Apesar dos desafios, o clima atual oferece oportunidades interessantes para os repositórios. Muitos financiadores estão promovendo ativamente a rota de repositório de artigos devido ao seu papel no apoio ao acesso equitativo aos conteúdos (ou seja, sem taxas para acesso ou depósitos).

A proposta de valor para a ciência aberta está crescendo e os repositórios são cada vez mais reconhecidos como o principal mecanismo de coleta e fornecimento de acesso a uma ampla gama de resultados de pesquisa. Some-se a isso o interesse nascente, mas crescente, no modelo publish-review-curate em que repositórios têm uma função central e parece que eles estão bem posicionados para expandir seu papel atual no ecossistema da Ciência Aberta.

Para apoiar este papel em evolução para repositórios, OpenAIRE, LIBER, SPARC Europe e o COAR identificaram três áreas em que é possível trabalhar em conjunto para ajudar a avançar e reforçar os repositórios na Europa:

1. Destacar a proposta de valor e defender o papel crítico dos repositórios na Europa
2. Propagar as melhores práticas para repositórios em todo o continente
3. Auxiliar na criação e coordenação de redes nacionais

== Resultados ==

Número de respondentes

Houve 394 respostas de 34 países da Europa, com 10 países (Áustria, Croácia, Alemanha, Itália, Polônia, Portugal, Sérvia, Espanha, Suíça, Reino Unido) em que cada enviou mais de 15 respostas. Em determinadas áreas, foi fornecido um pequeno instantâneo de certos resultados de cada um desses países e os analistas puderam empreender um aprofundamento da análise da situação.

Tipos de instituições

A maioria dos repositórios respondentes estava baseada em universidades, seguida de centros de  pesquisas. Os demais se enquadravam na categoria “outros”, composta por uma diversidade de tipos de instituições, incluindo bibliotecas, departamentos universitários, instituições, hospitais, entidades governamentais e organizações sem fins lucrativos. Dois dos repositórios dos respondentes eram gerenciados por editores. Na maioria das universidades os repositórios são gerenciados pela biblioteca.

Tipos de conteúdo predominantes no repositório

A maioria dos repositórios relatou coletar uma variedade de tipos de conteúdo, com 54% de respondentes indicando que o tipo de conteúdo predominante no repositório foi de artigos publicados (Tabela 1). Teses e dissertações são predominantes para 19% dos respondentes e dados de pesquisa para 13%. 14% dos entrevistados indicaram que preprints estavam no top 3 de seus tipos de conteúdo, mas apenas 1% (5 repositórios) relatou que foram os predominantes. Os repositórios que coletam predominantemente publicações (artigos, teses e preprints) geralmente coletam uma variedade de tipos de conteúdo, incluindo dados de pesquisa.

Número de itens no repositório

O tamanho das coleções (número de itens em cada repositório) variam significativamente entre repositórios de respondentes com cerca de 20% com menos de 1.000 itens, e os seis maiores repositórios com mais de um milhão de registros cada. O maior repositório Europe PMC contém mais de 8,5 milhões de registros de texto completo. A maioria dos repositórios são contêm de 1.000 a 10.000 itens (32,5%); 10.000 a 50.000 (27,5%); e menos de 1.000 itens (21.8%). Em média, o tamanho da coleção de repositórios institucionais é de 64.859 itens (repositórios que coletam seus resultados locais de pesquisa) e para outros repositórios ( repositórios nacionais) a média é de 386.088 itens.

Quem pode depositar

Mais de 75% dos repositórios da pesquisa atendem suas comunidades locais e oferecem atendimento apenas a pessoas vinculadas à instituição. 6% de dos repositórios dos respondentes estão abertos a qualquer pessoa, 4% estão abertos ao domínio público e 1% está aberto a pessoas de um país específico. A maioria dos 9% que escolheram a categoria ”outros’, esclareceram que ofereciam um serviço de depósito mediado, através do qual a equipe do repositório realizava o depósito do conteúdo em nome dos criadores. Portanto a parcela de repositórios institucionais era na verdade mais de 80%.

Plataformas de software

DSpace é o software mais comumente usado nas plataformas, com 41% dos entrevistados indicando que atualmente usam o software DSpace. Outras plataformas amplamente utilizadas são Eprints (11%), Fedora/Islandora (11%) e Dataverse (4%). Depois disso, várias outras plataformas também foram mencionadas: Invenio (3%), Pure (3%), OPUS (3%), Omega-PSIR (2%), Samvera (1%) e Figshare (1%) juntamente com uma variedade de outros tipos de softwares. Vale destacar que 8% dos os entrevistados que mantêm seus repositórios localmente (4% dos repositórios institucionais) usam um software desenvolvido localmente e 22% dos repositórios nacionais e generalistas desenvolveram localmente sua plataforma de software.

Esquemas de metadados

O esquema de metadados mais comum adotado em repositórios é o Dublin Core, onde 77% dos repositórios indicam que fornecem suporte para o Dublin Core. 26% fornecem suporte para o esquema DataCite, que foi inicialmente desenvolvido para dados da pesquisa e, sem surpresa, houve uma correlação positiva entre os repositórios que coletam dados de pesquisa e dão suporte ao esquema DataCite. Só menos da metade dos entrevistados indicou apoiar mais de um tipo de esquema de metadados.

Licenças

Quase todos os repositórios (96%) oferecem aos usuários a opção de escolher uma licença específica, as mais comuns são as licenças Creative Commons (91%). Alguns dos repositórios oferecem várias opções de licenciamento.

Identificadores de autor

Os IDs ORCID são bastante suportados, com 260 repositórios fornecendo metadados para o campo ORCID em seus registros (66%), 71 suporte National IDs (18%), e outros tipos de IDs também são suportados por 78 repositórios. 97 repositórios não suportam qualquer tipo de identificação do autor, o que representa cerca de 25% dos respondentes.

Identificadores persistentes de recursos (PID)

Muitos repositórios atribuem pelo menos um tipo de identificador persistente (PID) ao recursos depositados, sendo o mais comum o DOIs (Digital Object Identifier) – 46%, seguido por Identificadores (44%). 67 repositórios suportam ambos os identificadores e DOIs. Na categoria “outros”, a maioria indicou estar utilizando URN (Nome uniforme do recurso) ou ISSN. Cerca de 10% dos repositórios não atribuem /dão suporte a qualquer tipo de PID para os recursos em seu repositório.

Preservação

Aproximadamente 63% dos entrevistados (229) têm uma política formal de preservação em seu repositório, enquanto 37% (136) indicaram não ter política de preservação. Nos comentários, alguns entrevistados indicaram que estavam
no processo de elaboração de uma política (15); e vários entrevistados observaram que, embora não tenham uma política formal, eles têm uma variedade de práticas de preservação e procedimentos em vigor, incluindo a realização de cópias de segurança/espelhamento do conteúdo em outros lugares. Alguns repositórios são integrados com sistemas de preservação mais amplos.

Estatísticas de uso

A maioria dos repositórios entrevistados (73%) está coletando estatísticas de uso, com vários usando mais de um serviço de estatísticas de uso. Apenas 33 repositórios (cerca de 10%) indicaram que eles não coletam nenhum tipo de estatísticas de uso. O mais comum é o uso de a funcionalidade de estatísticas do repositório local, que é fornecida pelo software da plataforma.

Curadoria

A maioria dos repositórios aplica algum nível de curadoria após o depósito de um novo recurso. A validação de metadados é a mais comum (verificar se está correta e/ou completo), seguido de depósito mediado (depósito do pessoal do repositório em nome dos pesquisadores) e validação de conteúdo (verificação de formatos de arquivo e direitos autorais). Na categoria “outros”, os entrevistados listaram coisas como revisão para conformidade com outras diretrizes de depósito, validação baseada na verificação e revisão.

Pessoal

Depois de remover várias respostas atípicas com números irrealisticamente altos talvez devido a alguma interpretação errônea da pergunta, verificou-se que o número médio de pessoas por repositório era de pouco menos de 3 membros dedicados em tempo integral. A equipe para repositórios está distribuída em vários cargos: gerentes de repositório, suporte técnico, curadoria de metadados e conteúdo, e “outros” cargos. Metade da equipe de repositórios (47%) é dedicada à curadoria de metadados e conteúdo, com 27% na posição de gerente de repositório e 19% em posições de suporte técnico.. Mais da metade dos repositórios entrevistados tem 2 ou menos funcionários em tempo integral.

Soluções / estratégias

Em termos de ajudar a enfrentar os desafios existentes, os entrevistados classificaram várias atividades propostas como “um pouco” ou “muito” úteis. A maioria dos entrevistados classificaram todas as opções fornecidas como muito úteis ou um pouco úteis. A defesa de repositórios foi a mais bem classificada, com 58% indicando que seria muito útil e 34% dizendo que seria um pouco útil. Comunidade de prática para suporte técnico também foi visto como muito útil com 92% dos entrevistados. A coordenação de repositórios e treinamento de gestores também foi considerada como muito e um pouco útil para a grande maioria dos entrevistados (86% e 85% respectivamente). Uma plataforma nacional ou regional para hospedagem foi classificada como a mais baixa, mas ainda foi considerado útil por pouco mais de 50% dos entrevistados.

Confira o Relatório na íntegra, incluindo os Gráficos:

[1] Current State and Future Directions for Open Repositories in Europe. OpenAIRE, LIBER, SPARC Europe, and COAR, December 2023. Disponível em: https://www.abcd.usp.br/wp-content/uploads/2023/12/Report-of-European-repositories-survey-2023-2.pdf Acesso em: 13 dez. 2023.