Debian ima je napovedal, da je odprl novo splošno resolucijo (GR), tako da njihov razvijalci se odločijo ali so lahko modeli umetne inteligence (AI) del glavnega repozitorija in pod kakšnimi pogoji.
Čeprav se glasovanje še ni začelo, že poteka obdobje razprav med razvijalci projekta, ki bodo odločili inSmer, ki jo bo Debian ubral glede modelov strojnega učenja. V tem glasovanju lahko sodeluje približno tisoč razvijalcev z glasovalno pravico, ki so odgovorni za vzdrževanje paketov in celotno infrastrukturo projekta.
V središču razprave je vprašanjeAli lahko modele umetne inteligence, distribuirane pod odprtimi licencami, resnično štejemo za brezplačne, če ne vključujejo podatkov in orodij, potrebnih za njihovo učenje od začetka? Predlog v razpravi trdi, da ne, in ptrdi, da ti modeli niso združljivi s smernicami za prosto programsko opremo Debian (DFSG). Če bi bili odobreni, bi bili takšni modeli izključeni iz glavnega repozitorija, ne da bi se (vsaj zaenkrat) upoštevala njihova vključitev v razdelke, kot je nesvobodni.
Ugovori kažejo na osrednjo točko proste programske opremesposobnost spreminjanja, preučevanja in izboljševanja programa. V primeru modelov umetne inteligence bi bilo to mogoče le, če bi imeli dostop do podatkov za učenje in orodij, uporabljenih pri njihovi izdelavi. Brez teh elementov, trdijo zagovorniki resolucije, je spreminjanje modela praktično nemogoče. Tudi preprosta dejanja, kot je spreminjanje tokenizatorja za dodajanje podpore za nove jezike, postanejo herkulovska naloga, če procesa učenja ni mogoče reproducirati.
Pravna in varnostna tveganja
Pomisleki se ne nanašajo le na filozofijo in etiko distribucije, temveč tudi na nastanejo resne varnostne posledice. Zaradi nepreglednosti, ki jo povzroča odsotnost izvornih podatkov, ni mogoče preveriti zakonitosti podatkov, uporabljenih pri usposabljanju. To odpira vrata morebitnim kršitvam dovoljenj, Na primer, če so bili podatki GPL uporabljeni brez ustreznega navajanja avtorstva, zaradi česar ni mogoče ugotoviti, ali je bil model usposobljen na zaupnih ali avtorsko zaščitenih informacijah.
Poleg tega, Brez dostopa do izvornega gradiva postane odkrivanje napak ali ranljivosti naloga skoraj izključno izvirnega avtorja.. To povečuje odvisnost uporabnikov od določenega prodajalca in otežuje implementacijo popravkov ali popravkov. Še huje, zaradi tega je nemogoče pravilno pregledati model, zato bi lahko skrita vrata ali pristranskosti v njegovem vedenju ostale neopažene.
Razprava v skupnosti odprte kode
Vprašanje, kaj dejansko pomeni, da je sistem umetne inteligence "odprt", se intenzivno razpravlja v celotnem ekosistemu proste programske opreme, ne le v Debianu. Oktobra 2023 je pobuda za odprtokodno programsko opremo (OSI) objavila okvirno definicijo kaj bi morali šteti za odprtokodno umetno inteligenco. Ta definicija določa, da mora sistem umetne inteligence omogočati njegovo uporabo, preučevanje, spreminjanje in redistribucijo brez omejitevin vključuje zahteve, kot so popolna dokumentacija modela, uporabljeni podatki in metodologija usposabljanja.
Vendar pa Opredelitev OSI ne zahteva objave podatkov o usposabljanju kot takih, ampak le "podrobne informacije" o njih. To opustitev so ostro kritizirale organizacije, kot je SFC, ki trdi, da brez izvirnih podatkov ni mogoče v celoti izvajati temeljnih svoboščin spreminjanja in preučevanja.
OSI to priznava, vendar svojo odločitev upravičuje. Na podlagi praktičnih realnosti: mnogi podatki, ki se uporabljajo pri usposabljanju sodobnih modelov, so predmet komercialnih licenc, vsebujejo občutljive informacije ali pa jih preprosto ni mogoče zakonito prerazporediti. Trdijo, da bi vključitev klavzule, ki zahteva objavo, naredila vse obstoječe modele nezdružljive s katero koli definicijo odprtosti, koncept proste umetne inteligence pa bi ostal v nedosegljivi negotovosti.
Kakšno pot bo ubral Debian?
Ločljivost o katerem se zdaj razpravlja v Debianu bi lahko imel daljnosežen učinek, če bi bil sprejet, saj bi to pomenilo trdno stališče: brez učnih podatkov ali orodij za reprodukcijo modela ni prave svobode in zato v jedru Debiana ni mesta. Ta stroga razlaga svobode bi lahko prisilila številne široko uporabljene modele k izključitvi iz glavne distribucije, vključno z nekaterimi akademskimi ali poslovnimi dosežki, ki sicer objavljeni pod odprtimi licencami, ne izpolnjujejo tega standarda preglednosti in ponovljivosti.
Odločitev razvijalcev Debiana bi lahko postavila precedens na področju proste programske opreme in opredelila standarde, ki jih morajo izpolnjevati sistemi umetne inteligence, da bi veljali za resnično proste.
Končno, če ste zanima več o tem, podrobnosti lahko preverite v naslednja povezava.