Proyecto Dataverso: SW de repositorio de datos de investigación

Cada cierto tiempo, solemos pasearnos por el ámbito científico para conocer y divulgar sobre desarrollos, investigaciones e iniciativas científicas relacionadas o basadas en el uso de software libre y código abierto. Por ello, en otras oportunidades, de forma oportuna e idónea, hemos logrado dar a conocer no solo sobre novedades relacionadas con la creación o el uso de sistemas operativos (distribuciones) libres y abiertas basadas en GNU/Linux para el ámbito científico, sino sobre proyectos como OpenDreamKit y Proyecto Júpiter.

Y en esta oportunidad, el turno es para una genial y muy valiosa iniciativa científica llamada, El «Proyecto Dataverso». Vale destacar brevemente antes de iniciar, para aquellos que nunca han escuchado de la misma, que básicamente un software de repositorio de datos de investigación de código abierto.

OpenDreamKit y Project Jupyter: 2 Proyectos científicos de código abierto

Pero, antes de comenzar esta presente publicación sobre este genial reproductor de música llamado «Proyecto Dataverso» les recomendamos que, exploren luego esta otra anterior publicación relacionada:

Proyecto Dataverso: Aplicación web para datos de investigación

¿Qué es el Proyecto Dataverso?

Según su sitio web oficial, el «Proyecto Dataverso» es descrito brevemente de la siguiente forma:

El Proyecto Dataverso es una aplicación web de código abierto para compartir, preservar, citar, explorar y analizar datos de investigación. Facilita que los datos estén disponibles para otros y le permite replicar el trabajo de otros más fácilmente. Investigadores, revistas, autores de datos, editores, distribuidores de datos e instituciones afiliadas reciben crédito académico y visibilidad web.

Por lo que, haciendo similitudes con el mundo linuxero sería algo así como un GitLab o GitHub, pero para científicos.

Otros puntos importantes sobre el funcionamiento de esta iniciativa científica de código abierto a conocer, son los siguientes:

Un repositorio de Dataverso (o Dataverse en inglés) se crea o forma mediante la instalación del software del proyecto. Y este Dataverso creado, luego puede albergar varios archivos virtuales llamados colecciones de Dataverso.
A su vez, cada colección de Dataverso contiene conjuntos de datos, y cada conjunto de datos contiene metadatos descriptivos y archivos de datos (incluida la documentación y el código que acompaña a los datos). Además, de forma recursiva, este método de organización, permite que las colecciones de Dataverso también pueden contener otras colecciones de Dataverso.
El objetivo principal del Proyecto Dataverso es automatizar gran parte del trabajo manual que tiene a cargo un archivista profesional. Además, de proporcionar servicios y distribuir crédito al creador de los datos de investigación generados. Corrigiendo así, los malos efectos de la anterior práctica o metodología creada que consistía en que, los investigadores decidieran entre recibir crédito por sus datos, controlando ellos mismos la distribución, pero sin garantías de conservación a largo plazo, o el tener garantías de conservación a largo plazo, enviándolos a un archivo profesional pero sin recibir mucho crédito.

Características

Tal como se puede ver en su sitio web de GitHub, el software del Proyecto Dataverso está activo y en pleno desarrollo. Y entre sus muchas características vale destacar las siguientes:

Incluye soporte para los principios de datos FAIR (Findable, Accessible, Interoperable, Reusable): Es decir, Datos Localizables, Accesibles, Interoperables y Reutilizables.
Posee una API para interoperabilidad e integraciones personalizadas: Lo que facilita el uso de API de búsqueda, API de depósito de datos (SWORD), API de acceso a datos, API de métricas, API de migración, entre otras.
Integra compatibilidad con Bibliotecas de cliente de API: Lo que le permite Interactuar con las API de Dataverso de Python, R, Javascript, Java y Ruby.

Por último, actualmente este software tiene como última versión estable a la número 5.13, de fecha del 14 de febrero de 2023, la cual, incluye nuevas funciones, mejoras y correcciones de errores, gracias a su activa comunidad que suele contribuir con código, sugerencias, informes de errores y otros tipos de ayuda hacia dicho proyecto. Y si deseas saber más sobre el mismo, puedes explorar su demo en línea para conocerlo.

El Proyecto Dataverso se está desarrollando en el Instituto de Ciencias Sociales Cuantitativas (IQSS) de Harvard, junto con muchos colaboradores y contribuyentes en todo el mundo. El Proyecto Dataverso se basó en nuestra experiencia con nuestro anterior proyecto Virtual Data Center (VDC), que se extendió entre 1997 y 2006 como una colaboración entre el Centro de Datos Harvard-MIT (ahora parte de IQSS) y la Biblioteca de la Universidad de Harvard. Historia (origenes) del Proyecto Dataverso

Resumen

En resumen, el «Proyecto Dataverso» es, sin lugar a dudas, una de muchas iniciativas científicas desarrolladas con software libre y código abierto que merecen ser conocidas, difundidas y apoyadas, en beneficio del desarrollo humano. Por lo que, te invitamos a hacerlo, y en caso de ser necesario, cuéntanos vía comentarios que te parece esta iniciativa científica basada en código abierto. O si conoces de otra importante a reseñar, también será un placer conocerla para en un futuro próximo darle espacio en una publicación.

Y, si te ha gustado esta publicación, no dejes de compartirla con otros en tus sitios webs, canales, grupos o comunidades favoritas de redes sociales o sistemas de mensajería. Por último, recuerda visitar nuestra página de inicio en «DesdeLinux» para explorar más noticias. Y también, unirte a nuestro canal oficial de Telegram de DesdeLinux, o este grupo para más información sobre el tema de hoy.

DesdeLinux

Dataverso: Software de repositorio de datos de investigación de código abierto

Proyecto Dataverso: Aplicación web para datos de investigación

¿Qué es el Proyecto Dataverso?

Características

Resumen

Deja tu comentario Cancelar la respuesta