Copilot ، مساعد الذكاء الاصطناعي في GitHub تلقى انتقادات شديدة من مجتمع المصادر المفتوحة

قبل بضعة أيام نشارك هنا على المدونة خبر مساعد الطيار، وهو معالج ذكاء اصطناعي لكتابة كود GitHub والذي أقدمه بشكل أساسي كأداة مساعدة للمبرمجين.

على الرغم من أن مساعد الطيار يختلف عن أنظمة إكمال التعليمات البرمجية تقليدي للقدرة على تكوين كتل تعليمات برمجية معقدة للغاية ، وصولاً إلى وظائف جاهزة للاستخدام تم توليفها مع مراعاة السياق الحالي. مثل إن مساعد الطيار هو إحدى وظائف الذكاء الاصطناعي التي تعلمت من خلال عدة ملايين من أسطر التعليمات البرمجية ويتعرف على ما تخطط له بناءً على تعريف الوظيفة ، وما إلى ذلك.

في حين يمثل مساعد الطيار موفرًا كبيرًا للوقت نظرًا لتعلمها الملايين من أسطر التعليمات البرمجية ، والتي بدأت تثير مخاوف من أن الأداة يمكن أن تتحايل على متطلبات ترخيص المصدر المفتوح وتنتهك قوانين حقوق النشر.

ارمين روناتشر ، مطور بارز في مجتمع المصادر المفتوحة ، فهو أحد المطورين الذين شعرت بالإحباط من الطريقة التي تم بها بناء مساعد الطيار ، كما يذكر أنه جرب الأداة ونشر لقطة شاشة على Twitter فيها يذكر أنه بدا غريبًا بالنسبة له أن مساعد الطيار ، أداة ذكاء اصطناعي يتم تسويقها ، يمكن أن تنتج رمز حقوق الطبع والنشر.

بالنظر إلى هذا ، بدأ بعض المطورين في القلق من خلال استخدام الكود العام لتدريب الذكاء الاصطناعي للأداة. يتمثل أحد المخاوف في أنه إذا أعاد Copilot إنتاج أجزاء كبيرة بما يكفي من التعليمات البرمجية الحالية ، فقد ينتهك حقوق الطبع والنشر أو يغسل التعليمات البرمجية مفتوحة المصدر للاستخدام التجاري دون الترخيص المناسب (في الأساس سيف ذو حدين).

وبالإضافة إلى ذلك، تم توضيح أن الأداة يمكن أن تتضمن أيضًا معلومات شخصية نشره المطورون وفي حالة واحدة ، كرر الرمز المقتبس على نطاق واسع من لعبة Quake III Arena لعام 1999 على جهاز الكمبيوتر ، بما في ذلك تعليقات من المطور جون كارماك.

رفض Cole Garry ، المتحدث باسم Github ، التعليق وكان مقتنعًا بالإشارة إلى الأسئلة الشائعة الحالية للشركة على موقع Copilot على الويب ، والذي يقر بأن الأداة يمكن أن تنتج مقتطفات من النص من بيانات التدريب الخاصة بك.

يحدث هذا في حوالي 0.1٪ من الوقت ، وفقًا لـ GitHub ، عادةً عندما لا يوفر المستخدمون سياقًا كافيًا حول طلباتهم أو عندما يكون للمشكلة حل بسيط.

"نحن بصدد تنفيذ نظام تتبع الأصل لاكتشاف الحالات النادرة لتكرار الكود في جميع بيانات التدريب ، لمساعدتك على اتخاذ قرارات جيدة في الوقت الفعلي. فيما يتعلق باقتراحات GitHub Copilot ، "يقول الأسئلة الشائعة للشركة.

وفي الوقت نفسه ، جادل نات فريدمان ، الرئيس التنفيذي لشركة GitHub ، بأن تدريب أنظمة التعلم الآلي على البيانات العامة هو استخدام مشروع ، مع الاعتراف بأن "الملكية الفكرية والذكاء الاصطناعي سيكونان موضوع نقاش سياسي مثير للاهتمام." حيث ستشارك الشركة بنشاط.

كتب في إحدى تغريداته:

"كان GitHub Copilot ، باعترافه الخاص ، مبنيًا على جبال من كود GPL ، لذلك لست متأكدًا من أن هذا ليس شكلاً من أشكال غسيل الأموال. كود المصدر المفتوح في الأعمال التجارية. إن عبارة "لا يعيد إنتاج القطع الدقيقة" ليست مرضية للغاية ".

"حقوق الطبع والنشر لا تغطي فقط النسخ واللصق ؛ يغطي الأعمال المشتقة. تم بناء GitHub Copilot على كود مفتوح المصدر ومجموع كل ما تعرفه مأخوذ من هذا الكود. لا يوجد تفسير محتمل لمصطلح "مشتق" لا يشمل ذلك "، كتب. "لقد تم تدريب الجيل الأقدم من الذكاء الاصطناعي على النصوص والصور العامة ، حيث يصعب المطالبة بحقوق النشر ، ولكن هذا مأخوذ من الأعمال العظيمة ذات التراخيص الصريحة للغاية التي تم اختبارها من قبل المحاكم ، لذلك أتطلع إلى ما لا مفر منه / جماعي / إجراءات جسيمة في هذا الشأن ".

أخيرًا ، علينا أن ننتظر الإجراءات التي سيتخذها GitHub لتعديل الطريقة التي يتم بها تدريب Copilot ، لأنه في النهاية ، عاجلاً أم آجلاً ، الطريقة التي يولد بها الكود يمكن أن تضع أكثر من مطور في مشكلة.


كن أول من يعلق

اترك تعليقك

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها ب *

*

*

  1. المسؤول عن البيانات: ميغيل أنخيل جاتون
  2. الغرض من البيانات: التحكم في الرسائل الاقتحامية ، وإدارة التعليقات.
  3. الشرعية: موافقتك
  4. توصيل البيانات: لن يتم إرسال البيانات إلى أطراف ثالثة إلا بموجب التزام قانوني.
  5. تخزين البيانات: قاعدة البيانات التي تستضيفها شركة Occentus Networks (الاتحاد الأوروبي)
  6. الحقوق: يمكنك في أي وقت تقييد معلوماتك واستعادتها وحذفها.