Copilot, GitHub-ov AI asistent dobio je snažne kritike zajednice otvorenog koda

Prije nekoliko dana ovdje na blogu dijelimo vijesti o Copilotu, koji je čarobnjak za umjetnu inteligenciju za pisanje GitHub koda i koji u osnovi predstavljam kao alat za pomoć programerima.

Iako je Copilot razlikuje se od sustava za dovršavanje koda tradicionalno zbog mogućnosti oblikovanja prilično složenih blokova koda, do gotovih funkcija sintetiziranih uzimajući u obzir trenutni kontekst. Kao Copilot je AI funkcija koja je naučila kroz nekoliko milijuna linija koda i prepoznaje ono što planirate na temelju definicije funkcije itd.

dok Copilot predstavlja sjajnu uštedu vremena zbog svog učenja o milijunima redaka koda, što je počelo izazivati ​​strah da bi alat mogao zaobići zahtjeve za licenciranje otvorenog koda i kršiti zakone o autorskim pravima.

Armin Ronacher, istaknuti programer u zajednici otvorenog koda, jedan je od programera koji bio frustriran načinom na koji je izgrađen Copilot, kako spominje da je eksperimentirao s alatom i na Twitteru objavio snimku zaslona u kojoj spominje da mu se činilo čudnim da je Copilot, alat za umjetnu inteligenciju koji se komercijalizira, mogao proizvesti kod zaštićen autorskim pravima.

S obzirom na to, neki su programeri počeli biti uznemireni uporabom javnog koda za obuku umjetne inteligencije alata. Jedna je zabrinutost da bi Copilot, ako reproducira dovoljno velike dijelove postojećeg koda, mogao kršiti autorska prava ili oprati otvoreni kod za komercijalnu upotrebu bez odgovarajuće licence (u osnovi mač s dvije oštrice).

Osim toga, pokazalo se da alat može sadržavati i osobne podatke objavili programeri i u jednom slučaju, kopirao široko citirani kod iz PC igre Quake III Arena iz 1999., uključujući komentare programera Johna Carmacka.

Cole Garry, glasnogovornik Githuba, odbio je komentirati i zadovoljio se pozivima na postojeća FAQ tvrtke na web mjestu Copilot, koji priznaju da alat može stvoriti isječke teksta iz vaših podataka o treningu.

Prema GitHubu to se događa oko 0.1% vremena, obično kada korisnici ne daju dovoljno konteksta oko svojih zahtjeva ili kada problem ima trivijalno rješenje.

„U procesu smo implementacije sustava praćenja podrijetla kako bismo otkrili rijetke slučajeve ponavljanja koda u svim podacima obuke, koji će vam pomoći u donošenju dobrih odluka u stvarnom vremenu. Što se tiče prijedloga za GitHub Copilot ”, stoji u najčešćim pitanjima tvrtke.

U međuvremenu, izvršni direktor GitHub-a Nat Friedman ustvrdio je da je osposobljavanje sustava strojnog učenja na javnim podacima legitimna uporaba, istovremeno priznajući da će "intelektualno vlasništvo i umjetna inteligencija biti predmet zanimljive političke rasprave" u kojoj će tvrtka aktivno sudjelovati.

U jednom od svojih tweetova napisao je:

“GitHub Copilot je, prema vlastitom priznanju, izgrađen na planinama GPL koda, pa nisam siguran kako ovo nije oblik pranja novca. Otvoreni kod u komercijalnim radovima. Izraz "obično ne reproducira točne dijelove" nije baš zadovoljavajući ".

„Autorska prava ne obuhvaćaju samo kopiranje i lijepljenje; obuhvaća izvedena djela. GitHub Copilot izgrađen je na otvorenom izvornom kodu i zbroj svega što znate preuzet je iz tog koda. Ne postoji moguće tumačenje izraza "izvedeno" koje to ne uključuje ", napisao je. „Starija generacija umjetne inteligencije bila je obučena za javne tekstove i fotografije, na kojima je teže polagati autorska prava, ali ova je preuzeta iz sjajnih djela s vrlo eksplicitnim licencama koje su testirali sudovi, pa se radujem neizbježnom / kolektivnom / masovne akcije na ovome ”.

Konačno, moramo pričekati akcije koje će GitHub poduzeti kako bi izmijenio način na koji je Copilot osposobljen, jer na kraju, prije ili kasnije način na koji generira kôd može dovesti više problema u razvoj.


Ostavite svoj komentar

Vaša email adresa neće biti objavljen. Obavezna polja su označena s *

*

*

  1. Za podatke odgovoran: Miguel Ángel Gatón
  2. Svrha podataka: Kontrola neželjene pošte, upravljanje komentarima.
  3. Legitimacija: Vaš pristanak
  4. Komunikacija podataka: Podaci se neće dostavljati trećim stranama, osim po zakonskoj obvezi.
  5. Pohrana podataka: Baza podataka koju hostira Occentus Networks (EU)
  6. Prava: U bilo kojem trenutku možete ograničiti, oporaviti i izbrisati svoje podatke.