Copilot, ndihmësi i AI i GitHub mori kritika të forta nga komuniteti me burim të hapur

Disa ditë më parë ne ndajmë këtu në blog lajmet e Copilot, i cili është një magjistar i inteligjencës artificiale për shkrimin e kodit GitHub dhe të cilin unë në thelb e paraqes si një mjet ndihme për programuesit.

Edhe pse Kopilot ndryshon nga sistemet e kompletimit të kodit tradicionale për aftësinë për të formuar blloqe mjaft komplekse kodi, deri në funksione të gatshme për përdorim të sintetizuara duke marrë parasysh kontekstin aktual. Si Copilot është një funksion AI që ka mësuar përmes disa milion rreshtave të kodit dhe njeh atë që po planifikoni bazuar në përkufizimin e një funksioni, etj.

ndërsa Copilot përfaqëson një kursim të shkëlqyeshëm të kohës për shkak të mësimit të tij të miliona linjave të kodit, i cili ka filluar të ngrejë frikën se mjeti mund të anashkalojë kërkesat e licencimit me burim të hapur dhe të shkelë ligjet e së drejtës së kopjimit.

Armin Ronacher, një zhvillues i shquar në komunitetin me burim të hapur, ai është një nga zhvilluesit që u irritova me mënyrën e ndërtimit të pilotit, ndërsa përmend se eksperimentoi me mjetin dhe postoi një screenshot në Twitter në të cilin përmend se i dukej e çuditshme që Piloti, një mjet i inteligjencës artificiale që tregtohet, mund të prodhojë kod të mbrojtur nga e drejta e autorit.

Duke pasur parasysh këtë, disa zhvillues filluan të alarmohen me përdorimin e kodit publik për të trajnuar inteligjencën artificiale të mjetit. Një shqetësim është që nëse Copilot riprodhon copa mjaft të mëdha të kodit ekzistues, ai mund të shkelë të drejtën e kopjimit ose të pastrojë kodin e burimit të hapur për përdorim komercial pa licencën e duhur (në thelb një shpatë me dy tehe).

Përveç kësaj, u tregua se mjeti mund të përfshijë edhe informacione personale botuar nga zhvilluesit dhe në një rast, përsëriti kodin e cituar gjerësisht nga loja PC 1999 Quake III Arena, përfshirë komentet nga zhvilluesi John Carmack.

Cole Garry, një zëdhënës i Github, nuk pranoi të komentojë dhe ishte i kënaqur t'i referohej FAQ ekzistuese të kompanisë në faqen e internetit të Copilot, e cila pranon që mjeti mund të prodhojë fragmente teksti nga të dhënat tuaja të trajnimit.

Kjo ndodh rreth 0.1% të kohës, sipas GitHub, zakonisht kur përdoruesit nuk ofrojnë kontekst të mjaftueshëm rreth kërkesave të tyre ose kur problemi ka një zgjidhje të parëndësishme.

“Ne jemi në proces të implementimit të një sistemi gjurmimi të origjinës për të zbuluar raste të rralla të përsëritjes së kodit në të gjitha të dhënat e trajnimit, për t'ju ndihmuar të merrni vendime të mira në kohë reale. Lidhur me sugjerimet e GitHub Copilot, ”thotë FAQ e kompanisë.

Ndërkohë, CEO i GitHub, Nat Friedman argumentoi se sistemet e të mësuarit të makinës për të dhënat publike janë një përdorim i ligjshëm, ndërsa pranoi se "prona intelektuale dhe inteligjenca artificiale do të jenë subjekt i një diskutimi interesant politik." Në të cilën kompania do të marrë pjesë aktive.

Në një nga cicërimat e tij, ai shkruajti:

“GitHub Copilot, sipas pranimit të tij, ishte ndërtuar në male me kodin GPL, kështu që nuk jam i sigurt se si kjo nuk është një formë e pastrimit të parave. Kodi me burim të hapur në punët komerciale. Fraza "zakonisht nuk riprodhon pjesët e sakta" nuk është shumë e kënaqshme ".

“E drejta e autorit nuk përfshin vetëm kopjimin dhe ngjitjen; mbulon veprat derivative. GitHub Copilot u formua në kodin me burim të hapur dhe shuma totale e gjithçkaje që dini është marrë nga ai kod. Nuk ka interpretim të mundshëm të termit 'rrjedh' që nuk e përfshin këtë, 'shkroi ai. “Brezi i vjetër i UA u trajnua në tekste dhe fotografi publike, në të cilat është më e vështirë të kërkosh të drejtat e autorit, por kjo është marrë nga vepra të mëdha me licenca shumë të qarta të testuara nga gjykatat, kështu që unë pres që të pashmangshme / kolektive / veprime masive për këtë ”.

Më në fund, duhet të presim veprimet që GitHub do të ndërmarrë për të modifikuar mënyrën në të cilën trajnohet Copilot, pasi në fund të fundit, herët a vonë mënyra se si gjeneron kodi mund të vë në telashe më shumë se një zhvillues.


Bëhu i pari që komenton

Lini komentin tuaj

Adresa juaj e emailit nuk do të publikohet. Fusha e kërkuar janë shënuar me *

*

*

  1. Përgjegjës për të dhënat: Miguel Ángel Gatón
  2. Qëllimi i të dhënave: Kontrolloni SPAM, menaxhimin e komenteve.
  3. Legjitimimi: Pëlqimi juaj
  4. Komunikimi i të dhënave: Të dhënat nuk do t'u komunikohen palëve të treta përveç me detyrim ligjor.
  5. Ruajtja e të dhënave: Baza e të dhënave e organizuar nga Occentus Networks (BE)
  6. Të drejtat: Në çdo kohë mund të kufizoni, rikuperoni dhe fshini informacionin tuaj.