Copilot, asistent AI spoločnosti GitHub, bol ostro kritizovaný komunitou otvorených zdrojov

Pred niekoľkými dňami zdieľame tu na blogu správy o spoločnosti Copilot, čo je sprievodca umelou inteligenciou na písanie kódu GitHub a ktorého v podstate predstavujem ako pomocný nástroj pre programátorov.

Aj keď Copilot sa líši od systémov na dokončenie kódu tradičné kvôli schopnosti vytvárať pomerne zložité bloky kódu, až po pripravené funkcie syntetizované s prihliadnutím na súčasný kontext. Ako Copilot je funkcia AI, ktorá sa naučila prostredníctvom niekoľkých miliónov riadkov kódu a na základe definície funkcie rozpozná, čo plánujete, atď.

zatiaľ čo Copilot predstavuje skvelý šetrič času vďaka tomu, že sa naučil milióny riadkov kódu, čo začalo vyvolávať obavy, že by tento nástroj mohol obísť licenčné požiadavky open source a porušovať autorské práva.

Armin Ronacher, významný vývojár v komunite otvorených zdrojov je jedným z vývojárov, ktorí bol frustrovaný z toho, ako bol Copilot postavený, keď spomína, že s týmto nástrojom experimentoval a na Twitteri zverejnil snímku obrazovky spomína, že sa mu zdalo čudné, že Copilot, komerčne dostupný nástroj umelej inteligencie, mohol vytvoriť kód chránený autorskými právami.

Vzhľadom na to začali byť niektorí vývojári znepokojení využitím verejného kódu na školenie umelej inteligencie nástroja. Jednou z obáv je, že ak program Copilot reprodukuje dostatočne veľké kúsky existujúceho kódu, mohlo by to porušiť autorské práva alebo prať otvorený zdrojový kód na komerčné použitie bez príslušnej licencie (v zásade dvojsečného meča).

Okrem toho, ukázalo sa, že nástroj môže obsahovať aj osobné informácie zverejnené vývojármi a v jednom prípade replikoval široko citovaný kód z PC hry Quake III Arena z roku 1999, vrátane komentárov vývojára Johna Carmacka.

Cole Garry, hovorca spoločnosti Github, to odmietol komentovať a uspokojil sa s odkazom na existujúce časté otázky spoločnosti na webe Copilot, ktoré uznávajú, že tento nástroj dokáže z vašich tréningových údajov vygenerovať textové úryvky.

To sa podľa GitHubu stáva asi 0.1% času, zvyčajne keď používatelia neposkytnú dostatočný kontext okolo svojich požiadaviek alebo keď má problém triviálne riešenie.

„Sme v procese implementácie systému sledovania pôvodu, aby sme detekovali zriedkavé prípady opakovania kódu vo všetkých tréningových dátach, aby sme vám pomohli robiť dobré rozhodnutia v reálnom čase. Pokiaľ ide o návrhy GitHub Copilot, “uvádza sa v FAQ spoločnosti.

Generálny riaditeľ spoločnosti GitHub Nat Friedman medzitým tvrdil, že školenie systémov strojového učenia na verejných dátach je legitímne použitie, pričom uznal, že „duševné vlastníctvo a umelá inteligencia budú predmetom zaujímavej politickej diskusie“, na ktorej sa spoločnosť bude aktívne podieľať.

V jednom zo svojich tweetov napísal:

"GitHub Copilot bol podľa vlastného priznania postavený na horách kódu GPL, takže si nie som istý, či nejde o formu prania špinavých peňazí." Otvorený zdrojový kód v komerčných dielach. Fráza „zvyčajne nereprodukuje presné kúsky“ nie je veľmi uspokojivá.

„Autorské práva nezahŕňajú iba kopírovanie a vkladanie; zahŕňa odvodené diela. GitHub Copilot bol postavený na otvorenom zdrojovom kóde a z tohto kódu je prevzatý súčet všetkého, čo viete. Nie je možné interpretovať pojem „odvodený“, ktorý by to nezahŕňal, “napísal. „Staršia generácia umelej inteligencie bola trénovaná vo verejných textoch a fotografiách, na ktoré je ťažšie uplatniť autorské práva, ale táto je prevzatá zo skvelých diel s veľmi explicitnými licenciami testovanými súdmi, takže sa teším na nevyhnutné / kolektívne / masívne akcie v tejto oblasti “.

Nakoniec si musíme počkať na akcie, ktoré GitHub podnikne s cieľom upraviť spôsob trénovania aplikácie Copilot, pretože nakoniec spôsob generovania kódu môže skôr alebo neskôr spôsobiť viac problémov jednému vývojárovi.


Zanechajte svoj komentár

Vaša e-mailová adresa nebude zverejnená. Povinné položky sú označené *

*

*

  1. Zodpovedný za údaje: Miguel Ángel Gatón
  2. Účel údajov: Kontrolný SPAM, správa komentárov.
  3. Legitimácia: Váš súhlas
  4. Oznamovanie údajov: Údaje nebudú poskytnuté tretím stranám, iba ak to vyplýva zo zákona.
  5. Ukladanie dát: Databáza hostená spoločnosťou Occentus Networks (EU)
  6. Práva: Svoje údaje môžete kedykoľvek obmedziť, obnoviť a vymazať.