Dataverso: software de repositório de dados de pesquisa de código aberto

Projeto Dataverso: Repositório de dados de pesquisa SW

Projeto Dataverso: Repositório de dados de pesquisa SW

De tempos em tempos, costumamos passear pelo meio científico para conhecer e divulgar desenvolvimentos, pesquisas e iniciativas científicas relacionadas ou baseadas no uso de software livre e de código aberto. Por este motivo, em outras ocasiões, de forma oportuna e adequada, conseguimos dar a conhecer não só notícias relacionadas com a criação ou utilização de sistemas operativos (distribuições) gratuitos e abertos baseados em GNU/Linux para o campo científico, mas em projetos como OpenDreamKit e Projeto Júpiter.

E desta vez, a vez é de uma grande e valiosa iniciativa científica chamada The "Projeto Dataverse". Vale mencionar brevemente antes de começar, para quem nunca ouviu falar, que basicamente um ssoftware de repositório de dados de pesquisa de código aberto.

OpenDreamKit e Project Jupyter: 2 projetos científicos de código aberto

OpenDreamKit e Project Jupyter: 2 projetos científicos de código aberto

Mas, antes de começar este post sobre este tocador de música legal chamado "Projeto Dataverse" Recomendamos que você explore este outro mais tarde postagem relacionada anterior:

OpenDreamKit e Project Jupyter: 2 projetos científicos de código aberto
Artigo relacionado:
OpenDreamKit e Project Jupyter: 2 projetos científicos de código aberto

Projeto Dataverso: Aplicação Web para dados de pesquisa

Projeto Dataverso: Aplicação Web para dados de pesquisa

O que é o Projeto Dataverso?

De acordo com o seu Site oficial, o "Projeto Dataverse" É descrito resumidamente da seguinte forma:

O Projeto Dataverso é um aplicativo da web de código aberto para compartilhar, preservar, citar, explorar e analisar dados de pesquisa. Ele disponibiliza dados para outras pessoas e permite replicar mais facilmente o trabalho de outras pessoas. Pesquisadores, periódicos, autores de dados, editores, distribuidores de dados e instituições afiliadas recebem crédito acadêmico e visibilidade na web.

então, fazendo semelhanças com o mundo linux seria algo como um GitLab ou GitHub, mas para cientistas.

Outros pontos importantes sobre o funcionamento desta iniciativa científica de código aberto a saber são os seguintes:

  1. Um repositório Dataverso (ou Dataverse em inglês) é criado ou formado com a instalação do software do projeto. E este Dataverso criado pode então hospedar vários arquivos virtuais chamados coleções do Dataverso.
  2. Por sua vez, cada coleção do Dataverso contém conjuntos de dados e cada conjunto de dados contém metadados descritivos e arquivos de dados (incluindo documentação e código que acompanham os dados). Além disso, recursivamente, esse método de organização permite que as coleções do Dataverso também contenham outras coleções do Dataverso.
  3. O principal objetivo do Projeto Dataverso é automatizar grande parte do trabalho manual que um arquivista profissional tem que fazer. Além disso, para fornecer serviços e distribuir crédito ao criador dos dados de pesquisa gerados. Corrigindo assim os maus efeitos da prática ou metodologia anterior criada, que consistia em, os pesquisadores decidiram entre receber crédito por seus dados, controlando eles mesmos a distribuição, mas sem garantias de retenção de longo prazo, ou ter garantias de retenção de longo prazo, enviando-os para um arquivo profissional, mas sem receber muito crédito.

Características

Como pode ser visto em seu Site GitHub, o software Projeto Dataverso está ativo e em pleno desenvolvimento. E entre seus muitos Características Vale a pena notar o seguinte:

  1. Inclui suporte para princípios de dados FAIR (Encontrável, Acessível, Interoperável, Reutilizável): ou seja, dados Localizável, Acessível, Interoperável e Reutilizável.
  2. Possui uma API para interoperabilidade e integrações personalizadas: O que facilita o uso de API de Pesquisa, API de Data Warehouse (SWORD), API de Acesso a Dados, API de Métricas, API de Migração, entre outras.
  3. Integra suporte para bibliotecas de cliente de API: permitindo que você interaja com as APIs Dataverso de Python, R, Javascript, Java e Ruby.

Por fim, atualmente este software tem como última versão estável para o número 5.13, datado de 14 de fevereiro de 2023, que inclui novos recursos, melhorias e correções de bugs, graças à sua comunidade ativa que frequentemente contribui com código, sugestões, relatórios de bugs e outros tipos de ajuda para o referido projeto. E se você quiser saber mais sobre isso, você pode explore sua demonstração online para saber disso.

O Projeto Dataverse está sendo desenvolvido no Harvard's Institute for Quantitative Social Sciences (IQSS), juntamente com muitos colaboradores e contribuidores ao redor do mundo. O Projeto Dataverso baseou-se em nossa experiência com nosso projeto anterior de Virtual Data Center (VDC), que funcionou de 1997 a 2006 como uma colaboração entre o Harvard-MIT Data Center (agora parte do IQSS) e a Biblioteca da Universidade de Harvard. História (origens) do Projeto Dataverso

Artigo relacionado:
Chega o Open Science Project, um programa científico gratuito para expandir o conhecimento

Resumo: Banner post 2021

Resumo

Em resumo, o "Projeto Dataverse" é, sem dúvida, um dos muitos iniciativas científicas desenvolvidas com software livre e open source que merecem ser conhecidas, divulgadas e apoiadas, em benefício do desenvolvimento humano. Portanto, convidamos você a fazê-lo e, se necessário, diga-nos através de comentários o que você pensa sobre esta iniciativa científica baseada em código aberto. Ou se você souber de outra importante para revisar, também será um prazer conhecê-la para lhe dar espaço em uma publicação em um futuro próximo.

E se você gostou deste post, não pare de compartilhar com os outros em seus sites, canais, grupos ou comunidades de redes sociais ou sistemas de mensagens favoritos. Por último, lembre-se visite nossa página inicial en «FromLinux» para explorar mais notícias. E também, junte-se ao nosso canal oficial de Telegrama do FromLinux, Oeste grupo para mais informações sobre o tema de hoje.