Copilot, pomočnik za umetno inteligenco GitHub, je bil deležen močnih kritik s strani odprtokodne skupnosti

Pred nekaj dnevi tukaj na blogu delimo novice o podjetju Copilot, ki je čarovnik za umetno inteligenco za pisanje kode GitHub in ki ga v bistvu predstavljam kot orodje za pomoč programerjem.

Čeprav Copilot razlikuje od sistemov za dokončanje kode tradicionalna zaradi sposobnosti oblikovanja precej zapletenih blokov kode, do že pripravljenih funkcij, sintetiziranih ob upoštevanju trenutnega konteksta. Kot Copilot je funkcija umetne inteligence, ki se je naučila skozi več milijonov vrstic kode in prepozna, kaj načrtujete, na podlagi definicije funkcije itd.

Medtem ko Copilot predstavlja odličen prihranek časa zaradi učenja milijonov vrstic kode, ki je začelo vzbujati bojazen, da bi orodje lahko zaobšlo odprtokodne zahteve glede licenciranja in kršilo avtorske zakone.

Armin Ronacher, ugledni razvijalec v odprtokodni skupnosti je eden od razvijalcev, ki razočaran nad načinom izdelave Copilota, saj omenja, da je eksperimentiral z orodjem in na Twitterju objavil posnetek zaslona, ​​v katerem omenja, da se mu je zdelo nenavadno, da je Copilot, komercialno orodje za umetno inteligenco, lahko ustvari avtorsko zaščiteno kodo.

Glede na to so nekateri razvijalci začeli vznemirjati z uporabo javne kode za usposabljanje umetne inteligence orodja. Ena skrb je, da lahko Copilot, če reproducira dovolj velike dele obstoječe kode, krši avtorske pravice ali opere odprtokodno kodo za komercialno uporabo brez ustrezne licence (v bistvu dvorezen meč).

Poleg tega, pokazalo se je, da lahko orodje vključuje tudi osebne podatke objavili razvijalci in v enem primeru kopiral splošno citirano kodo iz računalniške igre Quake III Arena iz leta 1999, vključno s komentarji razvijalca Johna Carmacka.

Cole Garry, predstavnik Github-a, ni želel komentirati in se je zadovoljen skliceval na obstoječa pogosta vprašanja podjetja na spletnem mestu Copilot, ki priznavajo, da lahko orodje pripravi delčke besedila iz vaših podatkov o treningu.

Po navedbah GitHub se to zgodi približno 0.1% časa, običajno takrat, ko uporabniki ne dajejo dovolj konteksta okoli svojih zahtev ali če ima težava trivialno rešitev.

»V postopku smo uvedbe sistema za sledenje porekla, ki zazna redke primere ponavljanja kode v vseh podatkih o usposabljanju, ki vam pomaga v realnem času sprejeti dobre odločitve. Glede predlogov za GitHub Copilot, «pravijo pogosta vprašanja podjetja.

Medtem je izvršni direktor GitHub Nat Friedman trdil, da je usposabljanje sistemov strojnega učenja na javnih podatkih zakonita uporaba, hkrati pa je priznal, da bo "intelektualna lastnina in umetna inteligenca predmet zanimive politične razprave.", Pri kateri bo podjetje aktivno sodelovalo.

V enem od svojih tvitov je zapisal:

»GitHub Copilot je bil po lastnem priznanju zgrajen na gorah kode GPL, zato nisem prepričan, da ne gre za pranje denarja. Odprta koda v komercialnih delih. Besedna zveza "navadno ne reproducira natančno določenih kosov" ni preveč zadovoljiva ".

„Avtorske pravice ne zajemajo samo kopiranja in lepljenja; zajema izpeljana dela. GitHub Copilot je bil oblikovan v odprtokodni kodi in vsota vsega, kar veste, je vzeta iz te kode. Ni mogoče razlagati izraza "izpeljani", ki tega ne bi vključeval, "je zapisal. »Starejša generacija umetne inteligence je bila usposobljena za javna besedila in fotografije, na katerih je težje uveljavljati avtorske pravice, vendar je ta povzeta iz velikih del z zelo eksplicitnimi licencami, ki so jih preizkusila sodišča, zato se veselim neizogibnega / kolektivnega / množične akcije glede tega ".

Končno moramo počakati na ukrepe, ki jih bo GitHub sprejel, da bo spremenil način usposabljanja Copilota, saj lahko na koncu prej ali slej način ustvarjanja kode spravlja v težave več kot enega razvijalca.


Pustite svoj komentar

Vaš e-naslov ne bo objavljen. Obvezna polja so označena z *

*

*

  1. Za podatke odgovoren: Miguel Ángel Gatón
  2. Namen podatkov: Nadzor neželene pošte, upravljanje komentarjev.
  3. Legitimacija: Vaše soglasje
  4. Sporočanje podatkov: Podatki se ne bodo posredovali tretjim osebam, razen po zakonski obveznosti.
  5. Shranjevanje podatkov: Zbirka podatkov, ki jo gosti Occentus Networks (EU)
  6. Pravice: Kadar koli lahko omejite, obnovite in izbrišete svoje podatke.