Debian keskustelee tekoälymallien tulevaisuudesta ekosysteemissään

debian-gnu-linux

Debianilla on ilmoitti, että sillä on avasi uuden yleisen päätöslauselman (GR) niin, että heidän kehittäjät päättävät voivatko tekoälymallit olla osa päätietovarastoa ja millä ehdoilla.

Vaikka äänestysvaihe ei ole vielä alkanut, keskustelut hankkeen kehittäjien välillä ovat jo käynnissä. He päättävät jaDebianin suunta koneoppimismallien suhteen. Noin tuhat äänioikeutettua kehittäjää, jotka vastaavat pakettien ylläpidosta ja projektin yleisestä infrastruktuurista, on oikeutettu osallistumaan tähän äänestykseen.

Keskustelun ytimessä on kysymysVoidaanko avoimilla lisensseillä jaettuja tekoälymalleja todella pitää ilmaisina, jos ne eivät sisällä tietoja ja työkaluja, joita tarvitaan niiden kouluttamiseen alusta alkaen? Ehdotus keskustelussa väittää, että ei, javäittää, että nämä mallit ovat yhteensopimattomia Debianin vapaiden ohjelmistojen ohjeiden kanssa (DFSG). Jos se hyväksytään, tällaiset mallit suljetaan pois pääarkistosta ilman, että (ainakaan toistaiseksi) harkitaan niiden sisällyttämistä esimerkiksi ei-vapaisiin osioihin.

Vastaväitteet viittaavat vapaiden ohjelmistojen keskeiseen kohtaan: kyky muokata, tutkia ja parantaa ohjelmaa. Tekoälymallien tapauksessa tämä olisi mahdollista vain, jos sinulla on pääsy harjoitusdataan ja niiden rakentamisessa käytettyihin työkaluihin. Päätöslauselman kannattajien mukaan ilman näitä elementtejä mallin muokkaaminen on käytännössä mahdotonta. Jopa yksinkertaiset toiminnot, kuten tokenisaattorin muuttaminen uusien kielten tuen lisäämiseksi, muuttuvat herkulelaisen tehtäväksi, jos koulutusprosessia ei voida toistaa.

Oikeudelliset ja turvallisuusriskit

Huolenaiheet eivät koske pelkästään jakelun filosofiaa ja etiikkaa, vaan myös vakavia turvallisuusriskejä ilmenee. Lähdetietojen puuttumisen aiheuttama läpinäkymättömyys tekee koulutuksessa käytettyjen tietojen laillisuuden tarkistamisen mahdottomaksi. Tämä avaa oven mahdollisille luparikkomuksille, Esimerkiksi jos GPL-dataa käytettiin ilman asianmukaista lähteen mainintaa, jolloin oli mahdotonta määrittää, onko malli koulutettu luottamuksellisilla vai tekijänoikeuksin suojatuilla tiedoilla.

Lisäksi, Ilman pääsyä lähdemateriaaliin virheiden tai haavoittuvuuksien havaitseminen jää lähes yksinomaan alkuperäisen kirjoittajan tehtäväksi.. Tämä lisää käyttäjien riippuvuutta tietystä toimittajasta ja vaikeuttaa korjauspäivitysten tai korjausten käyttöönottoa. Vielä pahempaa on, että se tekee mallin asianmukaisen auditoinnin mahdottomaksi, joten sen käyttäytymisessä olevat takaportit tai piilevät vinoumat voivat jäädä huomaamatta.

Keskustelu avoimen lähdekoodin yhteisössä

Kysymystä siitä, mitä tekoälyjärjestelmän "avoimuus" oikeastaan ​​tarkoittaa, keskustellaan kiivaasti vapaiden ohjelmistojen ekosysteemissä, ei vain Debianissa. Lokakuussa 2023 Open Source Initiative (OSI) julkaisi alustavan määritelmän siitä, mitä tulisi pitää avoimen lähdekoodin tekoälynä. Tämä määritelmä määrittää, että tekoälyjärjestelmän on oltava käytettävissä, tutkittava, muokattava ja jaettava edelleen rajoituksetta, ja sisältää vaatimuksia, kuten mallin, käytettyjen tietojen ja koulutusmenetelmän täydellisen dokumentoinnin.

kuitenkin OSI-määritelmä ei edellytä harjoitusdatan julkaisemista sellaisenaan, vaan vain "yksityiskohtaista tietoa" heistä. Tätä laiminlyöntiä ovat arvostelleet ankarasti organisaatiot, kuten SFC, joka väittää, että ilman alkuperäistä dataa perusvapauksia muokkausta ja tutkimusta ei voida täysin toteuttaa.

OSI tunnustaa tämän näkökohdan, mutta perustelee päätöksensä Käytännön realiteetteihin perustuen: monet nykyaikaisten mallien kouluttamisessa käytetyistä tiedoista ovat kaupallisten lisenssien alaisia, sisältävät arkaluonteisia tietoja tai niitä ei yksinkertaisesti voida laillisesti jakaa edelleen. Heidän mukaansa julkaisemista vaativan lausekkeen sisällyttäminen tekisi kaikista olemassa olevista malleista yhteensopimattomia minkä tahansa avoimuuden määritelmän kanssa, jättäen vapaan tekoälyn käsitteen saavuttamattomaan epävarmuuteen.

Minkä polun Debian tulee kulkemaan?

Päätöslauselma josta keskustellaan nyt Debianissa voi olla kauaskantoisia vaikutuksia, jos se hyväksytään, koska se merkitsisi vankkaa kantaa: ilman harjoitusdataa tai työkaluja mallin toistamiseen ei ole todellista vapautta, eikä sille siksi ole sijaa Debianin ytimessä. Tämä vapauden tiukka tulkinta voisi pakottaa lukuisten laajalti käytettyjen mallien sulkemisen pois valtavirran jakelusta, mukaan lukien jotkin akateemiset tai liiketoiminnalliset kehityshankkeet, jotka eivät avoimilla lisensseillä julkaistuista julkaisuista huolimatta täytä tätä läpinäkyvyyden ja toistettavuuden vaatimusta.

Debianin kehittäjien tekemä päätös voisi luoda ennakkotapauksen vapaiden ohjelmistojen alalla ja määritellä standardit, jotka tekoälyjärjestelmien on täytettävä, jotta niitä voidaan pitää todella vapaina.

Lopuksi, jos olet kiinnostunut tietämään asiasta lisää, voit tarkistaa yksityiskohdat seuraava linkki.