Copilot, помічник ШІ GitHub, отримав сильну критику з боку спільноти з відкритим кодом

Кілька днів тому ми ділимось тут, у блозі, новинами Copilot, який є майстром штучного інтелекту для написання коду GitHub, і який я в основному представляю як допоміжний інструмент для програмістів.

Хоча Копілот відрізняється від систем заповнення коду традиційні через можливість формування досить складних блоків коду, до готових функцій, синтезованих з урахуванням поточного контексту. Як Copilot - це функція штучного інтелекту, яка вивчила кілька мільйонів рядків коду і він розпізнає, що ви плануєте, на основі визначення функції тощо.

Si Bien Копілот представляє велику економію часу завдяки вивченню мільйонів рядків коду, що почало викликати побоювання, що інструмент може обійти вимоги ліцензування з відкритим кодом та порушити законодавство про авторські права.

Армін Ронахер, видатний розробник у спільноті з відкритим кодом, він є одним із розробників, які засмутився способом побудови Копілота, оскільки він згадує, що експериментував з інструментом і опублікував скріншот у Twitter, в якому згадує, що йому здавалося дивним те, що копілот, інструмент штучного інтелекту, який комерціалізується, може створити захищений авторським правом код.

З огляду на це, деяких розробників почали насторожувати за використання публічного коду для навчання штучного інтелекту інструменту. Одне занепокоєння полягає в тому, що якщо Copilot відтворює досить великі шматки існуючого коду, він може порушити авторські права або відмити відкритий код для комерційного використання без відповідної ліцензії (в основному двосічного меча).

Крім того, було показано, що інструмент може також включати особисту інформацію опубліковані розробниками і в одному випадку, тиражував широко цитований код з ПК-гри Quake III Arena 1999 року, включаючи коментарі розробника Джона Кармака.

Коул Гаррі, представник Github, відмовився від коментарів і задовольнився посиланням на існуючі FAQ компанії на веб-сайті Copilot, де визнано, що інструмент може створювати фрагменти тексту з ваших навчальних даних.

За даними GitHub, це відбувається приблизно в 0.1% випадків, як правило, коли користувачі не надають достатньо контексту навколо своїх запитів або коли проблема має тривіальне рішення.

«Ми перебуваємо в процесі впровадження системи відстеження походження для виявлення рідкісних випадків повторення коду у всіх навчальних даних, щоб допомогти вам приймати правильні рішення в режимі реального часу. Щодо пропозицій GitHub Copilot », - йдеться у поширених запитаннях компанії.

Тим часом генеральний директор GitHub Нат Фрідман доводив, що навчання систем машинного навчання публічним даним є законним використанням, одночасно визнаючи, що "інтелектуальна власність та штучний інтелект будуть предметом цікавої політичної дискусії", в якій компанія братиме активну участь.

В одному зі своїх твітів він написав:

“GitHub Copilot, за його власним визнанням, був побудований на горах коду GPL, тому я не впевнений, що це не форма відмивання грошей. Відкритий вихідний код у комерційних роботах. Фраза "зазвичай не відтворює точних фрагментів" не дуже задовільна ".

“Авторське право охоплює не лише копіювання та вставлення; охоплює похідні твори. GitHub Copilot побудований на відкритому вихідному коді, і загальна сума всього, що ви знаєте, взята з цього коду. Існує неможливе тлумачення терміна "похідне", яке б не включало це ", - написав він. «Старше покоління ШІ навчалося публічним текстам та фотографіям, на які важче вимагати авторські права, але це взято з великих робіт з дуже чіткими ліцензіями, перевіреними судами, тому я з нетерпінням чекаю неминучого / колективного / масові дії з цього приводу ”.

Нарешті, нам доведеться почекати, які дії GitHub вживатиме, щоб змінити спосіб навчання Copilot, оскільки врешті-решт рано чи пізно спосіб генерації коду може спричинити неприємності більше ніж одному розробнику.


Зміст статті відповідає нашим принципам редакційна етика. Щоб повідомити про помилку, натисніть тут.

Будьте першим, щоб коментувати

Залиште свій коментар

Ваша електронна адреса не буде опублікований. Обов'язкові для заповнення поля позначені *

*

*

  1. Відповідальний за дані: Мігель Анхель Гатон
  2. Призначення даних: Контроль спаму, управління коментарями.
  3. Легітимація: Ваша згода
  4. Передача даних: Дані не передаватимуться третім особам, за винятком юридичних зобов’язань.
  5. Зберігання даних: База даних, розміщена в мережі Occentus Networks (ЄС)
  6. Права: Ви можете будь-коли обмежити, відновити та видалити свою інформацію.