DebianはエコシステムにおけるAIモデルの将来について議論する

debian-gnu-linux

Debianは 発表した 新たな一般決議を開いた (GR)彼らの 開発者が決定する AI (人工知能) モデルをメインリポジトリの一部にできるかどうか、またどのような条件で可能か。

投票段階はまだ始まっていないが、プロジェクト開発者間の議論期間はすでに始まっており、誰が決定し、Debianが機械学習モデルに関して取るべき方向性。パッケージのメンテナンスとプロジェクトの全体的なインフラストラクチャを担当し、投票権を持つ約 1,000 人の開発者がこの投票に参加する資格があります。

議論の中心にあるのは、オープン ライセンスで配布される AI モデルは、ゼロからトレーニングするために必要なデータとツールが含まれていない場合、本当に無料であるとみなせるのでしょうか? 提案 議論では、いいえ、pこれらのモデルはDebianのフリーソフトウェアガイドラインと互換性がないと主張している (DFSG)。承認された場合、そのようなモデルは、(少なくとも現時点では)非フリーなどのセクションに含めることを考慮せずに、メインリポジトリから除外されます。

反対意見はフリーソフトウェアの核心部分を指し示しているプログラムを修正、研究、改善する能力。 AI モデルの場合、これはトレーニング データとその構築に使用されるツールにアクセスできる場合にのみ可能になります。決議の支持者たちは、これらの要素がなければ、モデルを修正することは事実上不可能だと主張している。トークナイザーを変更して新しい言語のサポートを追加するなどの単純なアクションであっても、トレーニング プロセスを再現できない場合は大変な作業になります。

法的およびセキュリティ上のリスク

懸念されるのは、流通の哲学や倫理だけではありません。 重大なセキュリティ上の問題が生じます。 ソース データが存在しないことによって生じる不透明性により、トレーニングで使用されるデータの合法性を検証することが不可能になります。これ ライセンス違反の可能性が高まり、 たとえば、GPL データが適切な帰属表示なしに使用されると、モデルが機密情報または著作権で保護された情報に基づいてトレーニングされたかどうかを判断できなくなります。

さらに、 ソース マテリアルにアクセスできない場合、エラーや脆弱性の検出は、ほぼすべて元の著者の作業になります。。これにより、特定のベンダーに対するユーザーの依存度が高まり、パッチや修正の実装が複雑になります。さらに悪いことに、モデルを適切に監査することができなくなり、その動作におけるバックドアや隠れたバイアスが気付かれない可能性があります。

オープンソースコミュニティにおける議論

AI システムが「オープン」であることが実際に何を意味するのかという問題は、Debian だけでなく、フリー ソフトウェア エコシステム全体で激しい議論が交わされています。 2023年XNUMX月、オープンソース・イニシアティブ(OSI)は暫定的な定義を公開した。 オープンソース AI と見なすべきもの。この定義 AIシステムは制限なく使用、研究、改変、再配布を許可しなければならないことを規定するこれには、モデル、使用されるデータ、トレーニング方法の完全なドキュメントなどの要件が含まれます。

しかし、 OSIの定義では、トレーニングデータそのものの公開は要求されていない。 しかし、それらについての「詳細な情報」のみです。この省略はSFCなどの組織から厳しく批判されており、彼らは元のデータがなければ改変や研究の基本的な自由を完全に行使することはできないと主張している。

OSIはこの点を認識しているが、その決定を正当化している。 実際の現実に基づくと、最新のモデルのトレーニングに使用されるデータの多くは商用ライセンスの対象であったり、機密情報を含んでいたり、法的に再配布できないものであったりします。公表を義務付ける条項を含めると、既存のモデルはすべてオープン性のいかなる定義とも互換性がなくなり、自由な AI の概念は達成不可能な宙ぶらりんの状態になる、と彼らは主張している。

Debian はどのような道を進むのでしょうか?

解像度 これは現在Debianで議論されている 可決されれば広範囲にわたる影響を及ぼす可能性があるこれは、確固たる立場を示すものだからです。トレーニング データやモデルを再現するためのツールがなければ、本当の自由はなく、したがって、Debian カーネルには居場所がありません。この自由の厳格な解釈 広く使用されている多数のモデルを主流の流通から排除することを余儀なくされる可能性がある。 オープン ライセンスで公開されているにもかかわらず、透明性と再現性の基準を満たしていない学術的またはビジネス上の開発も含まれます。

Debian 開発者によるこの決定は、フリー ソフトウェアの先例となり、人工知能システムが真にフリーであるとみなされるために満たさなければならない基準を定義する可能性があります。

最後に、もしあなたが それについてもっと知りたい、詳細はで確認できます 次のリンク。