פרויקט Dataverso: מחקר מאגר נתונים SW
מדי פעם, אנו נוהגים לטייל בשטח המדעי כדי ללמוד ולהפיץ פיתוחים, מחקרים ויוזמות מדעיות הקשורות או מבוססות על שימוש בתוכנה חופשית ובקוד פתוח. מסיבה זו, בהזדמנויות אחרות, בזמן ובאופן מתאים, הצלחנו להודיע לא רק על חדשות הקשורות ליצירה או שימוש במערכות הפעלה חינמיות ופתוחות (הפצות) המבוססות על GNU/Linux לתחום המדעי, אבל בפרויקטים כמו OpenDreamKit ופרויקט יופיטר.
והפעם, התור הוא ליוזמה מדעית גדולה ורב ערך בשם, The "פרויקט Dataverse". כדאי להזכיר בקצרה לפני שמתחילים, למי שמעולם לא שמע על זה, שבעצם א sתוכנת קוד פתוח למחקר נתונים.
OpenDreamKit ו- Project Jupyter: 2 פרויקטים מדעיים בקוד פתוח
אבל, לפני שמתחילים את הפוסט הנוכחי על נגן המוזיקה המגניב הזה שנקרא "פרויקט Dataverse" אנו ממליצים לך לחקור את האחר הזה מאוחר יותר פוסט קשור קודם:

Dataverso Project: יישום אינטרנט לנתוני מחקר
מהו פרויקט Dataverso?
בהתאם ל אתר רשמי, "פרויקט Dataverse" הוא מתואר בקצרה כדלקמן:
פרויקט Dataverso הוא יישום אינטרנט בקוד פתוח לשיתוף, שימור, ציטוט, חקר וניתוח נתוני מחקר. זה הופך נתונים לזמינים לאחרים ומאפשר לך לשכפל ביתר קלות את העבודה של אחרים. חוקרים, כתבי עת, מחברי נתונים, מוציאים לאור, מפיצי נתונים ומוסדות קשורים מקבלים קרדיט אקדמי ונראות באינטרנט.
אז, עושה קווי דמיון עם עולם הלינוקס יהיה משהו כמו א GitLab או GitHub, אלא למדענים.
נקודות חשובות נוספות לגבי פעולתה של יוזמה מדעית זו בקוד פתוח שכדאי לדעת הן הבאות:
- מאגר Dataverso (או Dataverse באנגלית) נוצר או נוצר על ידי התקנת תוכנת הפרויקט. ו-Dataverso שנוצר לאחר מכן יכול לארח קבצים וירטואליים שונים הנקראים Dataverso collections.
- בתורו, כל אוסף Dataverso מכיל מערכי נתונים, וכל מערך נתונים מכיל מטא נתונים וקבצי נתונים תיאוריים (כולל תיעוד וקוד הנלווים לנתונים). בנוסף, באופן רקורסיבי, שיטת ארגון זו מאפשרת לאוספי Dataverso להכיל גם אוספי Dataverso אחרים.
- המטרה העיקרית של פרויקט Dataverso היא להפוך חלק גדול מהעבודה הידנית שארכיבאי מקצועי צריך לעשות. בנוסף, לספק שירותים ולחלק אשראי ליוצר נתוני המחקר שנוצרו. ובכך לתקן את ההשפעות הרעות של הפרקטיקה או המתודולוגיה הקודמת שנוצרה, אשר כללה, החליטו החוקרים בין קבלת קרדיט על הנתונים שלהם, שליטה בהפצה בעצמם, אך ללא ערבויות שמירה ארוכות טווח, או ערבות שמירה ארוכת טווח, לשלוח אותם לארכיון מקצועי אך מבלי לקבל הרבה קרדיט.
תכונות
כפי שניתן לראות אצלך אתר GitHub, תוכנת Dataverso Project פעילה ובפיתוח מלא. ובין רבים שלו אופי כדאי לשים לב לדברים הבאים:
- כולל תמיכה בעקרונות הנתונים של FAIR (ניתן למצוא, נגיש, ניתן לפעולה הדדית, לשימוש חוזר): כלומר נתונים ניתן לאתר, נגיש, ניתן לתפעול הדדי וניתן לשימוש חוזר.
- יש API עבור יכולת פעולה הדדית ואינטגרציות מותאמות אישית: מה שמקל על השימוש ב חיפוש API, Data Warehouse API (SWORD), Data Access API, Metrics API, Migration API, בין היתר.
- משלב תמיכה בספריות לקוח API: מאפשר לך ליצור אינטראקציה עם ממשקי ה-API של Dataverso של Python, R, Javascript, Java ו-Ruby.
לבסוף, נכון לעכשיו לתוכנה זו יש כ הגרסה היציבה האחרונה למספר 5.13, מתאריך 14 בפברואר 2023, הכולל תכונות חדשות, שיפורים ותיקוני באגים, הודות לקהילה הפעילה שלה, שלעתים קרובות תורמת קוד, הצעות, דוחות באגים וסוגים אחרים של עזרה לפרויקט האמור. ואם אתה רוצה לדעת יותר על זה, אתה יכול לחקור את ההדגמה המקוונת שלו לדעת זאת.
פרויקט Dataverse מפותח במכון למדעי החברה הכמותיים של הרווארד (IQSS), יחד עם משתפי פעולה ותורמים רבים ברחבי העולם. פרויקט Dataverso התבסס על הניסיון שלנו עם פרויקט מרכז הנתונים הוירטואלי (VDC) הקודם שלנו, שפעל מ-1997 עד 2006 כשיתוף פעולה בין מרכז הנתונים של הרווארד-MIT (כיום חלק מ-IQSS) והספרייה של אוניברסיטת הרווארד. היסטוריה (מקורות) של פרויקט Dataverso

תקציר
בקיצור, "פרויקט Dataverse" הוא, ללא ספק, אחד מני רבים יוזמות מדעיות שפותחו עם תוכנה חופשית וקוד פתוח שראוי להיות ידועים, מופצים ותומכים, לטובת ההתפתחות האנושית. לכן, אנו מזמינים אתכם לעשות זאת, ובמידת הצורך, ספרו לנו באמצעות הערות מה אתם חושבים על היוזמה המדעית הזו המבוססת על קוד פתוח. או אם אתם מכירים עוד אחת שחשובה לסקור, יהיה גם תענוג לפגוש אותה על מנת לתת לה מקום בפרסום בזמן הקרוב.
ואם אהבתם את הפוסט הזה, אל תפסיק לשתף אותו עם אחרים באתרי האינטרנט, הערוצים, הקבוצות או הקהילות המועדפות עליך של רשתות חברתיות או מערכות הודעות. לבסוף, זכור בקר בדף הבית שלנו en «מ- Linux» לחקור חדשות נוספות. וגם, הצטרף לערוץ הרשמי שלנו של מברק מ- FromLinux, מערב קבוצה למידע נוסף על הנושא של היום.