Copilot, GitHub AI asistents, saņēma lielu kritiku no atklātā pirmkoda kopienas

Pirms dažām dienām mēs šeit emuārā dalāmies ar Copilot jaunumiem, kas ir mākslīgā intelekta vednis GitHub koda rakstīšanai un kuru es galvenokārt uzrādu kā palīdzības rīku programmētājiem.

Pat ja Copilot atšķiras no kodu pabeigšanas sistēmām tradicionāli spēja veidot diezgan sarežģītus kodu blokus, līdz sintezētām lietošanai gatavām funkcijām, ņemot vērā pašreizējo kontekstu. Kā Copilot ir AI funkcija, kas ir iemācījusies, izmantojot vairākus miljonus koda rindiņu un tas atzīst, ko plānojat, pamatojoties uz funkcijas definīciju utt.

Kamēr Copilot ir lielisks laika ietaupītājs pateicoties tam, ka uzzinājis miljoniem koda rindiņu, kas sākusi raisīt bažas, ka rīks varētu apiet atvērtā koda licencēšanas prasības un pārkāpt autortiesību likumus.

Armīns Ronahers, ievērojams izstrādātājs atvērtā koda sabiedrībā viņš ir viens no izstrādātājiem, kas sajuka vilšanās par to, kā tika uzbūvēts Copilot, kā viņš min, ka eksperimentēja ar rīku un tviterī ievietoja ekrānuzņēmumu, kurā piemin, ka viņam likās dīvaini, ka Copilot, mākslīgā intelekta rīks, kas tiek komercializēts, varētu radīt ar autortiesībām aizsargātu kodu.

Ņemot to vērā, daži izstrādātāji sāka satraukties izmantojot publisko kodu, lai apmācītu rīka mākslīgo intelektu. Bažas rada tas, ka, ja Copilot reproducēs pietiekami lielus esošā koda gabalus, tas varētu pārkāpt autortiesības vai atmazgāt komerciālai lietošanai paredzētu atvērto pirmkodu bez atbilstošas ​​licences (būtībā divvirzienu zobena).

Turklāt, tika parādīts, ka rīks var ietvert arī personisko informāciju ko publicējuši izstrādātāji, un vienā gadījumā atkārtoja plaši citēto kodu no 1999. gada datorspēles Quake III Arena, ieskaitot izstrādātāja Džona Karmaka komentārus.

Github pārstāvis Kols Garijs atteicās komentēt un apmierinājās ar atsauci uz uzņēmuma esošajiem FAQ vietnē Copilot, kas atzīst, ka rīks var sagatavot teksta fragmentus no jūsu apmācības datiem.

Tas notiek apmēram 0.1% gadījumu, pēc GitHub domām, parasti tad, kad lietotāji nenodrošina pietiekamu kontekstu ap saviem pieprasījumiem vai ja problēmai ir niecīgs risinājums.

“Mēs izstrādājam izcelsmes izsekošanas sistēmu, lai visos treniņu datos atklātu retos koda atkārtošanās gadījumus, lai palīdzētu jums reāllaikā pieņemt labus lēmumus. Attiecībā uz GitHub Copilot ieteikumiem, ”teikts uzņēmuma FAQ.

Tikmēr GitHub izpilddirektors Nats Frīdmans apgalvoja, ka mašīnmācīšanās sistēmu apmācība par publiskiem datiem ir likumīga izmantošana, vienlaikus atzīstot, ka "intelektuālais īpašums un mākslīgais intelekts būs interesantas politiskas diskusijas priekšmets", kurā uzņēmums aktīvi piedalīsies.

Vienā no saviem tvītiem viņš rakstīja:

“GitHub Copilot, pēc pašas atzīšanas, tika būvēts uz GPL koda kalniem, tāpēc es neesmu pārliecināts, kā tas nav naudas atmazgāšanas veids. Atklāta pirmkoda komercdarbos. Frāze "parasti neatveido precīzus gabalus" nav ļoti apmierinoša ".

“Autortiesības attiecas ne tikai uz kopēšanu un ielīmēšanu; aptver atvasinātos darbus. GitHub Copilot tika veidots uz atvērtā pirmkoda, un visa šī informācija, ko jūs zināt, tiek ņemta no šī koda. Nav iespējams interpretēt terminu “atvasināts”, kas to neietver, ”viņš rakstīja. “Vecākā AI paaudze tika apmācīta publiskos tekstos un fotoattēlos, uz kuriem ir grūtāk pretendēt uz autortiesībām, taču šis ir ņemts no lieliskiem darbiem ar ļoti skaidru tiesu pārbaudītu licenci, tāpēc es ar nepacietību gaidu neizbēgamo / kolektīvo / masveida rīcība šajā sakarā ”.

Visbeidzot, mums jāgaida darbības, kuras GitHub veiks, lai modificētu Copilot apmācību, jo galu galā agri vai vēlu veids, kā tas ģenerē kodu, var radīt nepatikšanas vairākiem izstrādātājiem.


Raksta saturs atbilst mūsu principiem redakcijas ētika. Lai ziņotu par kļūdu, noklikšķiniet uz šeit.

Esi pirmais, kas komentārus

Atstājiet savu komentāru

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti ar *

*

*

  1. Atbildīgais par datiem: Migels Ángels Gatóns
  2. Datu mērķis: SPAM kontrole, komentāru pārvaldība.
  3. Legitimācija: jūsu piekrišana
  4. Datu paziņošana: Dati netiks paziņoti trešām personām, izņemot juridiskus pienākumus.
  5. Datu glabāšana: datu bāze, ko mitina Occentus Networks (ES)
  6. Tiesības: jebkurā laikā varat ierobežot, atjaunot un dzēst savu informāciju.