Si Copilot, ang katulong ni AI ng GitHub ay nakatanggap ng matinding pamimintas mula sa open source na komunidad

Ilang araw na nakalipas ibinabahagi namin dito sa blog ang balita ng Copilot, na kung saan ay isang artipisyal na wizard ng katalinuhan para sa pagsulat ng GitHub code at kung saan karaniwang ipinakita ko bilang isang tool sa tulong para sa mga programmer.

Kahit Copilot naiiba sa mga system ng pagkumpleto ng code tradisyonal para sa kakayahang bumuo ng medyo kumplikadong mga bloke ng code, hanggang sa mga handa nang gamitin na function na na-synthesize na isinasaalang-alang ang kasalukuyang konteksto. Bilang Ang Copilot ay isang pagpapaandar sa AI na natutunan sa pamamagitan ng maraming milyong mga linya ng code at kinikilala nito kung ano ang iyong pinaplano batay sa kahulugan ng isang pagpapaandar, atbp.

Habang Ang Copilot ay kumakatawan sa isang mahusay na tagatipid ng oras dahil sa pagkatuto nito ng milyun-milyong mga linya ng code, na nagsimula nang itaas ang mga takot na ang tool ay maaaring maiwasan ang mga kinakailangan sa bukas na mapagkukunan ng paglilisensya at lumalabag sa mga batas sa copyright.

Armin Ronacher, isang kilalang developer sa open source na komunidad, siya ay isa sa mga developer na nabigo sa paraan ng pagbuo ng Copilot, habang binabanggit niya na nag-eksperimento siya sa tool at nag-post ng isang screenshot sa Twitter kung saan nabanggit na tila kakaiba sa kanya na si Copilot, isang artipisyal na kasangkapan sa katalinuhan na na-komersyo, maaaring gumawa ng naka-copyright na code.

Dahil dito, nagsimulang mag-alarma ang ilang mga developer sa pamamagitan ng paggamit ng pampublikong code upang sanayin ang artipisyal na katalinuhan ng tool. Ang isang pag-aalala ay na kung ang Copilot ay nagpaparami ng sapat na mga tipak ng umiiral na code, maaari nitong hadlangan ang copyright o maghugas ng bukas na code ng mapagkukunan para sa komersyal na paggamit nang walang wastong lisensya (karaniwang isang dobleng talim ng tabak).

Bukod dito, ipinakita na ang tool ay maaari ring magsama ng personal na impormasyon nai-publish ng mga developer at sa isang kaso, kinopya ang malawak na naka-quote na code mula sa 1999 PC game Quake III Arena, kabilang ang mga komento mula sa developer na si John Carmack.

Si Cole Garry, isang tagapagsalita ng Github, ay tumangging magbigay ng puna at nilalaman na sumangguni sa umiiral na FAQ ng kumpanya sa website ng Copilot, na kinikilala na ang tool ay maaaring gumawa ng mga snippet ng teksto mula sa iyong data sa pagsasanay.

Nangyayari ito tungkol sa 0.1% ng oras, ayon sa GitHub, kadalasan kapag ang mga gumagamit ay hindi nagbibigay ng sapat na konteksto sa paligid ng kanilang mga kahilingan o kapag ang problema ay may isang maliit na solusyon.

"Nasa proseso kami ng pagpapatupad ng isang sistema ng pagsubaybay sa pinagmulan upang makita ang mga bihirang pagkakataon ng pag-uulit ng code sa lahat ng data ng pagsasanay, upang matulungan kang makagawa ng mahusay na mga desisyon nang real time. Tungkol sa mga mungkahi sa GitHub Copilot, "sabi ng FAQ ng kumpanya.

Samantala, sinabi ng CEO ng GitHub na si Nat Friedman na ang mga sistema ng pag-aaral ng machine machine sa pampublikong data ay isang lehitimong paggamit, habang kinikilala na ang "intelektuwal na pag-aari at artipisyal na intelektuwal ay magiging paksa ng isang kagiliw-giliw na talakayan sa politika." Kung saan aktibong lumahok ang kumpanya.

Sa isa sa kanyang mga tweet, isinulat niya:

"Ang GitHub Copilot ay, sa pamamagitan ng sarili nitong pagpasok, na itinayo sa mga bundok ng GPL code, kaya't hindi ako sigurado kung paano ito ay hindi isang paraan ng paglalaba ng pera. Buksan ang source code sa mga gawaing pangkalakalan. Ang pariralang "hindi karaniwang nagpaparami ng eksaktong mga piraso" ay hindi masyadong kasiya-siya ".

“Ang copyright ay hindi lamang sumasakop sa kopya at i-paste; sumasakop sa mga gawaing hango. Ang GitHub Copilot ay itinayo sa bukas na source code at ang kabuuan ng lahat ng alam mong kinuha mula sa code na iyon. Walang posibleng pagbibigay kahulugan sa salitang 'nagmula' na hindi kasama rito, 'isinulat niya. "Ang mas matandang henerasyon ng AI ay sinanay sa mga pampublikong teksto at larawan, kung saan mas mahirap na mag-angkin ng mga copyright, ngunit ang isang ito ay kinuha mula sa mahusay na mga gawa na may napaka-malinaw na mga lisensya na sinubukan ng mga korte, kaya inaasahan ko ang hindi maiiwasan / sama-sama / napakalaking pagkilos dito ”.

Sa wakas, kailangan nating maghintay para sa mga pagkilos na gagawin ng GitHub upang mabago ang paraan kung saan sinanay ang Copilot, dahil sa huli, maaga o huli ang paraan ng pagbuo nito ng code ay maaaring maglagay ng problema sa higit sa isang developer.


Iwanan ang iyong puna

Ang iyong email address ay hindi nai-publish. Mga kinakailangang patlang ay minarkahan ng *

*

*

  1. Responsable para sa data: Miguel Ángel Gatón
  2. Layunin ng data: Kontrolin ang SPAM, pamamahala ng komento.
  3. Legitimation: Ang iyong pahintulot
  4. Komunikasyon ng data: Ang data ay hindi maiparating sa mga third party maliban sa ligal na obligasyon.
  5. Imbakan ng data: Ang database na naka-host ng Occentus Networks (EU)
  6. Mga Karapatan: Sa anumang oras maaari mong limitahan, mabawi at tanggalin ang iyong impormasyon.