GitHub의 AI 비서 Copilot은 오픈 소스 커뮤니티에서 강한 비판을 받았습니다.

며칠 전 우리는 여기 블로그에서 Copilot의 뉴스를 공유합니다., GitHub 코드 작성을 위한 인공 지능 마법사이며 기본적으로 프로그래머를 위한 도움말 도구로 제시합니다.

비록 부조종사 코드 완성 시스템과 다름 기존 컨텍스트를 고려하여 합성 된 즉시 사용 가능한 기능까지 매우 복잡한 코드 블록을 형성 할 수 있기 때문에 전통적입니다. 같이 Copilot은 수백만 줄의 코드를 통해 학습 한 AI 기능입니다. 기능 등의 정의를 기반으로 계획중인 것을 인식합니다.

시 거냐 Copilot은 시간을 절약해 줍니다. 수백만 줄의 코드를 학습했기 때문에 도구가 오픈 소스 라이선스 요구 사항을 우회하고 저작권법을 위반할 수 있다는 두려움이 생기기 시작했습니다.

저명한 개발자, Armin Ronacher 오픈 소스 커뮤니티에서 그는 Copilot이 구축된 방식에 좌절했습니다. 그가 이 도구를 실험하고 트위터에 스크린샷을 게시했다고 언급하면서 부조종사가 그에게 이상하게 보였다고 언급합니다. 상용화된 인공지능 도구, 저작권이 있는 코드를 생성할 수 있습니다.

이를 감안할 때 일부 개발자는 놀라기 시작했습니다. 도구의 인공 지능을 훈련하기 위해 공개 코드를 사용합니다. 한 가지 우려 사항은 Copilot이 기존 코드의 충분히 큰 덩어리를 재생산하면 저작권을 침해하거나 적절한 라이선스(기본적으로 양날의 검) 없이 상업적 사용을 위해 오픈 소스 코드를 세탁할 수 있다는 것입니다.

또한, 도구에 개인 정보도 포함될 수 있는 것으로 나타났습니다. 개발자가 게시하고 한 경우에는 1999년 PC 게임 Quake III Arena에서 널리 인용된 코드를 복제했습니다. 개발자 John Carmack의 의견을 포함합니다.

Github 대변인인 Cole Garry는 언급을 거부했으며 Copilot 웹사이트에서 회사의 기존 FAQ를 참조하는 데 만족했습니다.

GitHub에 따르면 이것은 일반적으로 사용자가 요청에 대한 충분한 컨텍스트를 제공하지 않거나 문제에 사소한 해결책이 있을 때 약 0.1%의 시간에 발생합니다.

"우리는 실시간으로 올바른 결정을 내릴 수 있도록 모든 교육 데이터에서 드물게 반복되는 코드 인스턴스를 감지하는 원본 추적 시스템을 구현하는 중입니다. GitHub Copilot 제안과 관련하여 "회사의 FAQ.

한편 깃허브 CEO 냇 프리드먼은 공개 데이터를 기반으로 머신러닝 시스템을 훈련시키는 것은 정당한 사용이라고 주장하면서 “지적재산권과 인공지능이 흥미로운 정치적 논의의 대상이 될 것”이라고 인정하면서 회사가 적극 참여할 예정이다.

그의 트윗 중 하나에서 그는 다음과 같이 썼습니다.

“GitHub Copilot은 자체 승인에 따라 산더미 같은 GPL 코드를 기반으로 구축되었으므로 이것이 어떻게 자금 세탁의 한 형태가 아닌지 잘 모르겠습니다. 상업적 작업의 오픈 소스 코드. "일반적으로 정확한 조각을 재현하지 않는다"라는 문구는 그다지 만족스럽지 않습니다.

“저작권은 복사 및 붙여넣기에만 적용되는 것이 아닙니다. 파생물을 다룹니다. GitHub Copilot은 오픈 소스 코드를 기반으로 구축되었으며 사용자가 알고 있는 모든 항목의 합계는 해당 코드에서 가져옵니다. 이것을 포함하지 않는 '파생'이라는 용어에 대한 가능한 해석은 없습니다. "기존 세대의 AI는 저작권 주장이 더 어려운 공개 텍스트와 사진에 대해 훈련을 받았지만, 이것은 법원에서 테스트한 매우 명시적인 라이선스로 훌륭한 작품에서 가져온 것이기 때문에 불가피한/집단적 / 이에 대한 대규모 조치”.

마지막으로, Copilot이 훈련되는 방식을 수정하기 위해 GitHub가 취할 조치를 기다려야 합니다. 결국 조만간 코드를 생성하는 방식이 둘 이상의 개발자를 곤경에 빠뜨릴 수 있기 때문입니다.


코멘트를 남겨주세요

귀하의 이메일 주소는 공개되지 않습니다. 필수 필드가 표시되어 있습니다 *

*

*

  1. 데이터 책임자 : Miguel Ángel Gatón
  2. 데이터의 목적 : 스팸 제어, 댓글 관리.
  3. 합법성 : 귀하의 동의
  4. 데이터 전달 : 법적 의무에 의한 경우를 제외하고 데이터는 제 XNUMX 자에게 전달되지 않습니다.
  5. 데이터 저장소 : Occentus Networks (EU)에서 호스팅하는 데이터베이스
  6. 권리 : 귀하는 언제든지 귀하의 정보를 제한, 복구 및 삭제할 수 있습니다.