לדביאן יש הודיעה כי יש לה פתחה החלטה כללית חדשה (GR) כך ש המפתחים מחליטים האם מודלים של בינה מלאכותית (AI) יכולים להיות חלק מהמאגר הראשי, ובאילו תנאים.
למרות ששלב ההצבעה טרם החל, תקופת הדיונים בין מפתחי הפרויקט כבר בעיצומה, אשר יחליטו ו...הכיוון שדביאן תיקח בנוגע למודלים של למידת מכונה. כ-1,000 מפתחים בעלי זכויות הצבעה, האחראים על תחזוקת החבילות ועל התשתית הכוללת של הפרויקט, זכאים להשתתף בהצבעה זו.
בלב הדיון עומדת שאלההאם מודלים של בינה מלאכותית המופצים תחת רישיונות פתוחים באמת יכולים להיחשב חופשיים אם הם אינם כוללים את הנתונים והכלים הדרושים לאימון שלהם מאפס? ההצעה בדיון טוען שלא, ו-pטוענת שמודלים אלה אינם תואמים את הנחיות התוכנה החופשית של דביאן (DFSG). אם יאושרו, מודלים כאלה יורחקו מהמאגר הראשי, מבלי לשקול (לפחות לעת עתה) הכללתם במדורים כמו לא חופשי.
ההתנגדויות מצביעות על נקודה מרכזית של תוכנה חופשיתהיכולת לשנות, ללמוד ולשפר תוכנית. במקרה של מודלים של בינה מלאכותית, זה אפשרי רק אם יש לך גישה לנתוני האימון ולכלים המשמשים בבנייתם. ללא אלמנטים אלה, טוענים תומכי ההחלטה, שינוי מודל הוא כמעט בלתי אפשרי. אפילו פעולות פשוטות, כמו שינוי טוקנייזר כדי להוסיף תמיכה בשפות חדשות, הופכות למשימה הרקולסית אם לא ניתן לשחזר את תהליך האימון.
סיכונים משפטיים וביטחוניים
החששות אינם נוגעים רק לפילוסופיה ולאתיקה של ההפצה, אלא גם מתעוררות השלכות ביטחוניות חמורות. האטימות הנוצרת מהיעדר נתוני מקור הופכת את אימות חוקיות הנתונים המשמשים באימון לבלתי אפשרי. זֶה פותח דלת להפרות רישיון אפשריות, לדוגמה, אם נעשה שימוש בנתוני GPL ללא ייחוס מתאים, מה שיגרום לכך שלא יהיה ניתן לקבוע אם המודל אומן על מידע סודי או מוגן בזכויות יוצרים.
בנוסף, ללא גישה לחומר המקור, גילוי שגיאות או פגיעויות הופך למשימה כמעט בלעדית של המחבר המקורי.. זה מגביר את תלות המשתמש בספק ספציפי ומסבך את יישום הטלאים או התיקונים. גרוע מכך, זה הופך את זה לבלתי אפשרי לבקר את המודל כראוי, כך שדלתות אחוריות או הטיות נסתרות בהתנהגותו עלולות לחמוק מעיניו.
הדיון בקהילת הקוד הפתוח
השאלה מה המשמעות בפועל של "פתוחה" של מערכת בינה מלאכותית נדונה באופן אינטנסיבי ברחבי המערכת האקולוגית של התוכנה החופשית, לא רק בדביאן. באוקטובר 2023, פרסמה יוזמת הקוד הפתוח (OSI) הגדרה זמנית של מה שצריך להיחשב כבינה מלאכותית בקוד פתוח. הגדרה זו קובע כי מערכת בינה מלאכותית חייבת לאפשר את השימוש בה, המחקר שלה, השינוי שלה והפצתה מחדש ללא הגבלות, וכולל דרישות כגון תיעוד מלא של המודל, הנתונים שבהם נעשה שימוש ומתודולוגיית האימון.
עם זאת, הגדרת ה-OSI אינה דורשת פרסום של נתוני אימון ככאלה, אלא רק "מידע מפורט" עליהם. השמטה זו ספגה ביקורת קשה מצד ארגונים כמו ה-SFC, הטוענים כי ללא הנתונים המקוריים, לא ניתן לממש במלואם את חירויות היסוד של שינוי ומחקר.
ה-OSI מכיר בנקודה זו, אך מצדיק את החלטתו. בהתבסס על מציאות מעשית: רבים מהנתונים המשמשים באימון מודלים מודרניים כפופים לרישיונות מסחריים, מכילים מידע רגיש, או פשוט לא ניתנים להפצה מחדש באופן חוקי. הכללת סעיף המחייב פרסום, הם טוענים, תהפוך את כל המודלים הקיימים ללא תואמים לכל הגדרה של פתיחות, ותותיר את מושג הבינה המלאכותית החופשית במצב של לימבו בלתי מושג.
באיזה מסלול דביאן תנקוט?
התוצאה אשר כעת נדון בדביאן יכולה להיות השפעה מרחיקת לכת אם תאושר, שכן הדבר יסמן עמדה נחרצת: ללא נתוני אימון או כלים לשחזור המודל, אין חופש אמיתי, ולכן, אין מקום בליבת דביאן. פרשנות מחמירה זו של חופש עלול לאלץ את הדרתם של דגמים רבים הנמצאים בשימוש נרחב מההפצה המרכזית, כולל כמה פיתוחים אקדמיים או עסקיים אשר, למרות שפורסמו תחת רישיונות פתוחים, אינם עומדים בסטנדרט זה של שקיפות ושחזור.
ההחלטה שקיבלנו מפתחי דביאן עשויה לקבוע תקדים בתחום התוכנה החופשית ולהגדיר את הסטנדרטים שמערכות בינה מלאכותית חייבות לעמוד בהם כדי להיחשב חופשיות באמת.
לבסוף, אם כן מעוניין לדעת יותר על זה, אתה יכול לבדוק את הפרטים ב הקישור הבא.