Debian ir paziņoja, ka tam ir atvēra jaunu vispārēju rezolūciju (GR) tā, lai viņu izstrādātāji izlemj vai AI (mākslīgā intelekta) modeļi var būt daļa no galvenās krātuves un ar kādiem nosacījumiem.
Lai gan balsošanas fāze vēl nav sākusies, diskusiju periods starp projekta attīstītājiem jau ir sācies, un viņi pieņems lēmumu.Debian virziens mašīnmācīšanās modeļu jomā. Šajā balsojumā ir tiesīgi piedalīties aptuveni tūkstotis izstrādātāju ar balsstiesībām, kas ir atbildīgi par pakotņu uzturēšanu un projekta kopējo infrastruktūru.
Debašu centrā ir jautājumsVai mākslīgā intelekta modeļus, kas izplatīti saskaņā ar atvērtajām licencēm, patiešām var uzskatīt par bezmaksas, ja tie neietver datus un rīkus, kas nepieciešami, lai tos apmācītu no nulles? Priekšlikums diskusijā apgalvo, ka nē, unapgalvo, ka šie modeļi nav saderīgi ar Debian brīvās programmatūras vadlīnijām (DFSG). Ja šādi modeļi tiktu apstiprināti, tie tiktu izslēgti no galvenās krātuves, neapsverot (vismaz pagaidām) to iekļaušanu tādās sadaļās kā nebrīvie.
Iebildumi norāda uz brīvās programmatūras centrālo punktu.: spēja modificēt, pētīt un uzlabot programmu. Mākslīgā intelekta modeļu gadījumā tas būtu iespējams tikai tad, ja jums ir piekļuve apmācības datiem un to veidošanā izmantotajiem rīkiem. Bez šiem elementiem, rezolūcijas atbalstītāji apgalvo, modeļa modificēšana ir praktiski neiespējama. Pat vienkāršas darbības, piemēram, tokenizera maiņa, lai pievienotu atbalstu jaunām valodām, kļūst par Herkulesa uzdevumu, ja apmācības procesu nevar reproducēt.
Juridiskie un drošības riski
Bažas nav tikai par izplatīšanas filozofiju un ētiku, bet arī par rodas nopietnas drošības problēmas. Necaurredzamība, ko rada avota datu trūkums, neļauj pārbaudīt apmācībā izmantoto datu likumību. Šis paver durvis potenciāliem licences pārkāpumiem, Piemēram, ja GPL dati tika izmantoti bez pienācīgas atsauces, padarot neiespējamu noteikt, vai modelis tika apmācīts ar konfidenciālu vai ar autortiesībām aizsargātu informāciju.
Turklāt, Bez piekļuves avota materiālam kļūdu vai ievainojamību atklāšana kļūst par gandrīz tikai oriģinālā autora uzdevumu.. Tas palielina lietotāju atkarību no konkrēta pārdevēja un sarežģī ielāpu vai labojumu ieviešanu. Vēl ļaunāk, tas neļauj pienācīgi auditēt modeli, tāpēc slēptās neobjektivitātes vai tā uzvedībā varētu palikt nepamanītas.
Debates atvērtā koda kopienā
Jautājums par to, ko īsti nozīmē būt “atvērtai” mākslīgā intelekta sistēmai, tiek intensīvi apspriests visā brīvās programmatūras ekosistēmā, ne tikai Debian vidē. 2023. gada oktobrī Atvērtā pirmkoda iniciatīva (OSI) publicēja provizorisku definīciju par to, kas būtu jāuzskata par atvērtā pirmkoda mākslīgo intelektu. Šī definīcija nosaka, ka mākslīgā intelekta sistēmai ir jāļauj to izmantot, pētīt, modificēt un izplatīt bez ierobežojumiem, un ietver tādas prasības kā pilnīga modeļa, izmantoto datu un apmācības metodoloģijas dokumentācija.
Tomēr, OSI definīcija neprasa publicēt apmācības datus kā tādus, bet tikai “detalizēta informācija” par tiem. Šo izlaidumu ir asi kritizējušas tādas organizācijas kā SFC, kas apgalvo, ka bez sākotnējiem datiem nevar pilnībā īstenot pamatbrīvības attiecībā uz modificēšanu un pētīšanu.
OSI atzīst šo viedokli, bet pamato savu lēmumu Balstoties uz praktisko realitāti: daudzi no datiem, ko izmanto mūsdienu modeļu apmācībā, ir pakļauti komerciālām licencēm, satur sensitīvu informāciju vai vienkārši nav likumīgi izplatāmi. Iekļaujot klauzulu par publicēšanas prasību, viņi apgalvo, ka visi esošie modeļi kļūtu nesaderīgi ar jebkuru atvērtības definīciju, atstājot brīvā mākslīgā intelekta koncepciju nesasniedzamā nenoteiktībā.
Kādu ceļu ies Debian?
Rezolūcija kas tagad tiek apspriests Debian vidē varētu radīt tālejošas sekas, ja tās tiktu pieņemtas, jo tas iezīmētu stingru nostāju: bez apmācības datiem vai rīkiem modeļa reproducēšanai nav īstas brīvības, un tāpēc tam nav vietas Debian kodolā. Šī stingrā brīvības interpretācija varētu piespiest daudzus plaši izmantotus modeļus izslēgt no galvenās izplatīšanas, tostarp dažas akadēmiskas vai uzņēmējdarbības izstrādes, kas, lai gan publicētas saskaņā ar atvērtajām licencēm, neatbilst šim pārredzamības un reproducējamības standartam.
Debian izstrādātāju pieņemtais lēmums varētu radīt precedentu brīvās programmatūras jomā un definēt standartus, kuriem mākslīgā intelekta sistēmām jāatbilst, lai tās tiktu uzskatītas par patiesi brīvām.
Visbeidzot, ja esat interesē uzzināt vairāk par to, sīkāku informāciju varat pārbaudīt šī saite.