Copilot, asistent AI GitHubu, byl silně kritizován komunitou open source

Před pár dny sdílíme zde na blogu novinky o Copilotu, což je průvodce umělou inteligencí pro psaní kódu GitHub a který v zásadě představuji jako pomocný nástroj pro programátory.

Přesto Copilot se liší od systémů pro dokončení kódu tradiční kvůli schopnosti tvořit poměrně složité bloky kódu, k připraveným funkcím syntetizovaným s přihlédnutím k aktuálnímu kontextu. Tak jako Copilot je funkce AI, která se naučila prostřednictvím několika milionů řádků kódu a rozpozná, co plánujete, na základě definice funkce atd.

Si bien Copilot představuje skvělou úsporu času díky tomu, že se naučil miliony řádků kódu, což začalo vyvolávat obavy, že by tento nástroj mohl obejít licenční požadavky open source a porušovat autorská práva.

Armin Ronacher, významný vývojář v komunitě otevřených zdrojů je jedním z vývojářů, kteří frustroval způsob, jakým byl Copilot postaven, když zmiňuje, že s tímto nástrojem experimentoval a na Twitteru zveřejnil snímek obrazovky zmiňuje, že mu připadalo divné, že Copilot, komerčně dostupný nástroj umělé inteligence, mohl vytvořit kód chráněný autorskými právy.

Vzhledem k tomu začali být někteří vývojáři znepokojeni pro použití veřejného kódu k trénování umělé inteligence nástroje. Jednou z obav je, že pokud Copilot reprodukuje dostatečně velké kusy stávajícího kódu, mohlo by to porušovat autorská práva nebo prát otevřený zdrojový kód pro komerční použití bez řádné licence (v zásadě dvojsečný meč).

Navíc, ukázalo se, že nástroj může obsahovat i osobní údaje zveřejněné vývojáři a v jednom případě, replikoval široce citovaný kód z PC hry Quake III Arena z roku 1999, včetně komentářů od vývojáře Johna Carmacka.

Cole Garry, mluvčí Githubu, to odmítl komentovat a spokojil se s odkazem na existující FAQ společnosti na webu Copilot, který uznává, že nástroj může z vašich tréninkových dat vytvářet textové úryvky.

K tomu dochází podle GitHub přibližně 0.1% času, obvykle když uživatelé neposkytují dostatek kontextu kolem svých požadavků nebo když má problém triviální řešení.

"Jsme v procesu implementace systému sledování původu, abychom detekovali vzácné případy opakování kódu ve všech tréninkových datech, abychom vám pomohli činit správná rozhodnutí v reálném čase." Pokud jde o návrhy GitHub Copilot, “uvádí FAQ společnosti.

Mezitím generální ředitel GitHubu Nat Friedman tvrdil, že školení systémů strojového učení na veřejných datech je legitimní použití, přičemž uznává, že „duševní vlastnictví a umělá inteligence budou předmětem zajímavé politické diskuse“, na které se společnost bude aktivně podílet.

V jednom ze svých tweetů napsal:

"GitHub Copilot byl podle vlastního přiznání postaven na horách kódu GPL, takže si nejsem jistý, jak to není forma praní peněz." Otevřený zdrojový kód v komerčních pracích. Fráze „obvykle nereprodukuje přesné kousky“ není příliš uspokojivá.

"Autorské právo nezahrnuje pouze kopírování a vkládání; pokrývá odvozená díla. GitHub Copilot byl postaven na otevřeném zdrojovém kódu a součet všeho, co víte, je převzat z tohoto kódu. Neexistuje žádný možný výklad pojmu „odvozený“, který by toto nezahrnoval, “napsal. "Starší generace umělé inteligence byla trénována ve veřejných textech a fotografiích, na které je obtížnější domáhat se autorských práv, ale tato je převzata ze skvělých děl s velmi explicitními licencemi testovanými soudy, takže se těším na nevyhnutelné / kolektivní / masivní akce v této oblasti “.

Nakonec musíme počkat na akce, které GitHub provede, aby upravil způsob, jakým je Copilot trénován, protože nakonec způsob, jakým generuje kód, může dříve nebo později způsobit více než jednoho vývojáře.


Zanechte svůj komentář

Vaše e-mailová adresa nebude zveřejněna. Povinné položky jsou označeny *

*

*

  1. Odpovědný za údaje: Miguel Ángel Gatón
  2. Účel údajů: Ovládací SPAM, správa komentářů.
  3. Legitimace: Váš souhlas
  4. Sdělování údajů: Údaje nebudou sděleny třetím osobám, s výjimkou zákonných povinností.
  5. Úložiště dat: Databáze hostovaná společností Occentus Networks (EU)
  6. Práva: Vaše údaje můžete kdykoli omezit, obnovit a odstranit.