Copilot, GitHub-ov AI asistent dobio je snažne kritike zajednice otvorenog koda

Prije nekoliko dana ovdje na blogu dijelimo vijesti o kompaniji Copilot, koji je čarobnjak za umjetnu inteligenciju za pisanje GitHub koda i koji u osnovi predstavljam kao alat za pomoć programerima.

Iako Copilot razlikuje se od sistema za dovršavanje koda tradicionalno za sposobnost formiranja prilično složenih blokova koda, do gotovih funkcija sintetiziranih uzimajući u obzir trenutni kontekst. As Copilot je AI funkcija koja je naučila kroz nekoliko miliona linija koda i prepoznaje ono što planirate na osnovu definicije funkcije itd.

Dok Kopilot predstavlja sjajnu uštedu vremena zbog svog učenja o milionima linija koda, što je počelo rađati strah da bi alat mogao zaobići zahtjeve za licenciranje otvorenog koda i prekršiti zakone o autorskim pravima.

Armin Ronacher, istaknuti programer u zajednici otvorenog koda, jedan je od programera koji bio frustriran načinom na koji je izgrađen Copilot, pošto spominje da je eksperimentirao s alatom i na Twitteru objavio snimak zaslona u kojem spominje da mu se činilo čudnim da je Copilot, alat za umjetnu inteligenciju koji se komercijalizira, mogao proizvesti zaštićeni kod.

S obzirom na ovo, neki programeri su počeli biti uznemireni upotrebom javnog koda za obuku umjetne inteligencije alata. Jedna je zabrinutost da bi Copilot, ako reprodukuje dovoljno velikih dijelova postojećeg koda, mogao kršiti autorska prava ili oprati otvoreni kod za komercijalnu upotrebu bez odgovarajuće licence (u osnovi mač s dvije oštrice).

Takođe, pokazalo se da alat može sadržavati i lične podatke objavili programeri i u jednom slučaju, replicirao široko citirani kod iz PC igre Quake III Arena iz 1999. godine, uključujući komentare programera Johna Carmacka.

Cole Garry, glasnogovornik Github-a, odbio je komentirati i zadovoljio se pozivima na postojeća FAQ kompanije na web mjestu Copilot, koji priznaju da alat može stvoriti isječke teksta iz vaših podataka o obuci.

Prema GitHub-u, to se događa oko 0.1% vremena, obično kada korisnici ne daju dovoljno konteksta oko svojih zahtjeva ili kada problem ima trivijalno rješenje.

„U procesu smo implementacije sistema praćenja porijekla kako bismo otkrili rijetke slučajeve ponavljanja koda u svim podacima obuke, koji će vam pomoći u donošenju dobrih odluka u stvarnom vremenu. Što se tiče prijedloga za GitHub Copilot “, kažu česta pitanja kompanije.

U međuvremenu, izvršni direktor GitHub-a Nat Friedman ustvrdio je da je obuka sistema mašinskog učenja na javnim podacima legitimna upotreba, istovremeno priznajući da će "intelektualno vlasništvo i umjetna inteligencija biti predmet zanimljive političke rasprave" u kojoj će kompanija aktivno sudjelovati.

U jednom od svojih tweetova napisao je:

„GitHub Copilot je, prema vlastitom priznanju, izgrađen na planinama GPL koda, tako da nisam siguran kako ovo nije oblik pranja novca. Otvoreni kod u komercijalnim radovima. Izraz "obično ne reproducira tačne dijelove" nije baš zadovoljavajući ".

„Autorska prava ne pokrivaju samo kopiranje i lijepljenje; pokriva izvedene radove. GitHub Copilot izgrađen je na otvorenom izvornom kodu i zbroj svega što znate preuzet je iz tog koda. Ne postoji moguće tumačenje izraza „izvedeno“ koje to ne uključuje “, napisao je. „Starija generacija umjetne inteligencije bila je obučena za javne tekstove i fotografije, na kojima je teže polagati autorska prava, ali ova je preuzeta iz sjajnih djela s vrlo eksplicitnim licencama koje su testirali sudovi, pa se radujem neizbježnom / kolektivnom / masovne akcije na ovome ”.

Konačno, moramo pričekati akcije koje će GitHub poduzeti kako bi izmijenio način na koji je Copilot osposobljen, jer na kraju, prije ili kasnije način na koji generira kôd može dovesti više problema u razvoj.


Sadržaj članka pridržava se naših principa urednička etika. Da biste prijavili grešku, kliknite ovdje.

Budite prvi koji komentarišete

Ostavite komentar

Vaša e-mail adresa neće biti objavljena. Obavezna polja su označena sa *

*

*

  1. Za podatke odgovoran: Miguel Ángel Gatón
  2. Svrha podataka: Kontrola neželjene pošte, upravljanje komentarima.
  3. Legitimacija: Vaš pristanak
  4. Komunikacija podataka: Podaci se neće dostavljati trećim stranama, osim po zakonskoj obavezi.
  5. Pohrana podataka: Baza podataka koju hostuje Occentus Networks (EU)
  6. Prava: U bilo kojem trenutku možete ograničiti, oporaviti i izbrisati svoje podatke.