GitHubのAIアシスタントであるCopilotは、オープンソースコミュニティから強い批判を受けました

何日か前に コパイロットのニュースをブログで共有します、これはGitHubコードを記述するための人工知能ウィザードであり、基本的にプログラマー向けのヘルプツールとして提示します。

副操縦士なのに コード補完システムとは異なります 現在のコンテキストを考慮して合成された、すぐに使用できる関数まで、非常に複雑なコードブロックを形成する機能で伝統的です。 なので Copilotは、数百万行のコードを通じて学習したAI関数です。 関数の定義などに基づいて、計画している内容を認識します。

Siのビエン コパイロットは時間の節約になります 数百万行のコードを学習したため、ツールがオープンソースライセンス要件を回避し、著作権法に違反する可能性があるという懸念が高まり始めました。

著名な開発者、Armin Ronacher オープンソースコミュニティでは、彼は開発者のXNUMX人です。 コパイロットの構築方法に不満を感じ、 彼がツールを試し、Twitterにスクリーンショットを投稿したと述べているように 副操縦士が彼にとって奇妙に思えたと述べている 商業化されている人工知能ツール、 著作権で保護されたコードを生成する可能性があります。

これを考えると、一部の開発者は警戒し始めました ツールの人工知能を訓練するための公開コードの使用による。 XNUMXつの懸念は、Copilotが既存のコードの十分な大きさのチャンクを複製する場合、適切なライセンス(基本的に両刃の剣)なしで著作権を侵害したり、商用利用のためにオープンソースコードをロンダリングしたりする可能性があることです。

さらに、 ツールには個人情報も含めることができることが示されました 開発者によって公開され、ある場合には、 1999年のPCゲームQuakeIII Arenaから広く引用されているコードを複製し、 開発者のジョン・カーマックからのコメントを含みます。

GithubのスポークスマンであるColeGarryはコメントを拒否し、Copilot Webサイトにある同社の既存のFAQを参照することに満足しました。これは、ツールがトレーニングデータからテキストスニペットを生成できることを認めています。

GitHubによると、これは約0.1%の確率で発生します。通常、ユーザーがリクエストに関する十分なコンテキストを提供していない場合、または問題の解決策が簡単な場合です。

「私たちは、すべてのトレーニングデータで繰り返されるコードのまれなインスタンスを検出し、リアルタイムで適切な意思決定を行えるようにするために、起点追跡システムを実装しているところです。 GitHub Copilotの提案に関しては、」と同社のFAQは述べています。.

一方、GitHubのCEOであるナットフリードマンは、公開データに関する機械学習システムのトレーニングは合法的な使用法であると主張し、同社が積極的に参加する「知的財産と人工知能は興味深い政治的議論の対象になる」と認めました。

彼のツイートのXNUMXつで、彼は次のように書いています。

「GitHubCopilotは、独自の承認により、GPLコードの山の上に構築されていたため、これがマネーロンダリングの形式ではないかどうかはわかりません。 商業作品のオープンソースコード。 「通常、正確な部分を再現しない」というフレーズは、あまり満足のいくものではありません。

「著作権はコピーアンドペーストだけをカバーするのではありません。 二次的著作物をカバーします。 GitHub Copilotはオープンソースコードで形成されており、あなたが知っているすべての合計はそのコードから取得されます。 これを含まない「派生」という用語の可能な解釈はありません」と彼は書いています。 「旧世代のAIは、著作権を主張するのが難しい公開テキストや写真でトレーニングされていましたが、これは裁判所によってテストされた非常に明示的なライセンスを持つ優れた作品から取られたものなので、避けられない/集合的なものを楽しみにしています/これに対する大規模なアクション」。

最後に、GitHubがCopilotのトレーニング方法を変更するために実行するアクションを待つ必要があります。これは、最終的に、コードの生成方法が遅かれ早かれ複数の開発者を困らせる可能性があるためです。


コメントを残す

あなたのメールアドレスが公開されることはありません。 必須フィールドには付いています *

*

*

  1. データの責任者:MiguelÁngelGatón
  2. データの目的:SPAMの制御、コメント管理。
  3. 正当化:あなたの同意
  4. データの伝達:法的義務がある場合を除き、データが第三者に伝達されることはありません。
  5. データストレージ:Occentus Networks(EU)がホストするデータベース
  6. 権利:いつでも情報を制限、回復、削除できます。