Копилот, асистентот за АИ на GitHub доби силна критика од заедницата со отворен извор

Пред неколку дена ги споделуваме овде на блогот вестите за Копилот, што е волшебник за вештачка интелигенција за пишување на GitHub код и кој во основа го претставувам како алатка за помош за програмерите.

И покрај тоа Копилот се разликува од системите за комплетирање кодови традиционален поради можноста да се формираат прилично сложени блокови на кодови, до готови функции синтетизирани земајќи го предвид сегашниот контекст. Како што Пилотот е функција за AI, која научила преку неколку милиони линии на код и тоа препознава што планирате врз основа на дефинирање на функција, итн.

Додека Копилот претставува одлична заштеда на време поради учењето на милиони линии код, што започна да ги зголемува стравувањата дека алатката може да ги заобиколи барањата за лиценцирање со отворен извор и да ги крши законите за авторски права

Армин Ронахер, истакнат развивач во заедницата со отворен извор, тој е еден од развивачите кои се фрустрирав со начинот на кој е изграден Копилот, како што споменува дека експериментирал со алатката и објавил скриншот на Твитер во кој споменува дека му се чинело чудно што Копилот, алатка за вештачка интелигенција која е комерцијализирана, може да произведе заштитен код.

Со оглед на ова, некои програмери започнаа да бидат вознемирени со употреба на јавен код за обука на вештачката интелигенција на алатката. Една загриженост е дека ако Копилот репродуцира доволно големи парчиња постоечки код, тоа може да прекрши авторски права или да пере код со отворен извор за комерцијална употреба без соодветна лиценца (во основа меч со две острици).

Покрај тоа, се покажа дека алатката може да вклучува и лични информации објавено од развивачите и во еден случај, го реплицираше широко цитираниот код од компјутерската игра Quake III Arena во 1999 година, вклучувајќи ги и коментарите од инвеститорот Johnон Кармак.

Кол Гари, портпарол на Гитуб, одби да даде коментар и беше задоволен да се повика на постојните најчесто поставувани прашања на компанијата на веб-страницата Копилот, што потврдува дека алатката може да произведе парчиња текст од вашите податоци за обука.

Ова се случува околу 0.1% од времето, според GitHub, обично кога корисниците не обезбедуваат доволно контекст околу нивните барања или кога проблемот има тривијално решение.

„Ние сме во процес на имплементација на систем за следење на потекло за да откриеме ретки случаи на повторување на кодот во сите податоци за обука, за да ви помогнеме да донесете добри одлуки во реално време. Во врска со предлозите на GitHub Copilot “, се вели во ЧПП на компанијата.

Во меѓувреме, извршниот директор на GitHub, Нат Фридман, тврди дека системите за обука на машини за обука на јавни податоци се легитимна употреба, притоа признавајќи дека „интелектуалната сопственост и вештачката интелигенција ќе бидат предмет на интересна политичка дискусија“ во која компанијата активно ќе учествува.

Во еден од своите твитови тој напиша:

„GitHub Copilot, по сопствено признание, беше изграден на планини со GPL-код, па не сум сигурен како ова не е форма на перење пари. Код со отворен извор во комерцијални дела. Фразата „обично не ги репродуцира точните парчиња“ не е многу задоволителна “.

„Авторските права не опфаќаат само копирање и лепење; опфаќа изведени дела. GitHub Copilot е изграден на код со отворен извор и вкупниот збир на сè што знаете е земен од тој код. Не постои можно толкување на поимот „изведен“ што не го вклучува ова “, напиша тој. „Постарата генерација на АИ беше обучена за јавни текстови и фотографии, на кои е потешко да се тврдат авторски права, но ова е преземено од одлични дела со многу експлицитни лиценци тестирани од судовите, затоа се радувам на неизбежниот / колективниот / масовни активности за ова “.

Конечно, мора да почекаме за активностите што ќе ги преземе GitHub за да го измени начинот на обука на Copilot, бидејќи на крајот, порано или подоцна начинот на генерирање на кодот може да доведе во неволја повеќе од еден развивач.


Содржината на статијата се придржува до нашите принципи на уредничка етика. За да пријавите грешка, кликнете овде.

Биди прв да коментираш

Оставете го вашиот коментар

Вашата е-маил адреса нема да бидат објавени.

*

*

  1. Одговорен за податоците: Мигел Анхел Гатон
  2. Цел на податоците: Контролирајте СПАМ, управување со коментари.
  3. Легитимација: Ваша согласност
  4. Комуникација на податоците: Податоците нема да бидат соопштени на трети лица освен со законска обврска.
  5. Складирање на податоци: База на податоци хостирани од Occentus Networks (ЕУ)
  6. Права: Во секое време можете да ги ограничите, вратите и избришете вашите информации.