Copilot, GitHub के AI सहायक को ओपन सोर्स समुदाय से कड़ी आलोचना मिली

कुछ दिनों पहले हम यहां ब्लॉग पर Copilot की खबर साझा करते हैं, जो गिटहब कोड लिखने के लिए एक कृत्रिम बुद्धि विज़ार्ड है और जिसे मैं मूल रूप से प्रोग्रामर के लिए सहायता उपकरण के रूप में प्रस्तुत करता हूं।

भले ही Copilot कोड पूर्णता प्रणाली से अलग है वर्तमान संदर्भ को ध्यान में रखते हुए संश्लेषित उपयोग के लिए तैयार कार्यों तक, काफी जटिल कोड ब्लॉक बनाने की क्षमता के लिए पारंपरिक। जैसा Copilot एक AI फ़ंक्शन है जो कोड की कई मिलियन लाइनों के माध्यम से सीखा है और यह पहचानता है कि आप किसी फ़ंक्शन की परिभाषा के आधार पर क्या योजना बना रहे हैं, आदि।

सी bien Copilot एक महान समय बचाने वाले का प्रतिनिधित्व करता है कोड की लाखों पंक्तियों को सीखने के कारण, जिससे यह आशंका पैदा हो गई है कि यह टूल ओपन सोर्स लाइसेंसिंग आवश्यकताओं को दरकिनार कर सकता है और कॉपीराइट कानूनों का उल्लंघन कर सकता है।

आर्मिन रोनाचर, एक प्रमुख डेवलपर ओपन सोर्स कम्युनिटी में, वह उन डेवलपर्स में से एक है जो Copilot के निर्माण के तरीके से निराश हो गए, जैसा कि उन्होंने उल्लेख किया है कि उन्होंने टूल के साथ प्रयोग किया और ट्विटर पर एक स्क्रीनशॉट पोस्ट किया जिसमें उल्लेख करता है कि उसे यह अजीब लग रहा था कि कोपिलॉट, एक कृत्रिम बुद्धिमत्ता उपकरण जिसका व्यावसायीकरण किया जाता है, कॉपीराइट कोड का उत्पादन कर सकता है।

इसे देखते हुए, कुछ डेवलपर्स चिंतित होने लगे उपकरण की कृत्रिम बुद्धि को प्रशिक्षित करने के लिए सार्वजनिक कोड के उपयोग द्वारा। एक चिंता यह है कि यदि कोपिलॉट मौजूदा कोड के काफी बड़े हिस्से को पुन: पेश करता है, तो यह कॉपीराइट का उल्लंघन कर सकता है या उचित लाइसेंस (मूल रूप से एक दोधारी तलवार) के बिना व्यावसायिक उपयोग के लिए ओपन सोर्स कोड को लॉन्डर कर सकता है।

इसके अलावा, यह दिखाया गया था कि टूल में व्यक्तिगत जानकारी भी शामिल हो सकती है डेवलपर्स द्वारा प्रकाशित और एक मामले में, 1999 पीसी गेम क्वेक III एरिना से व्यापक रूप से उद्धृत कोड को दोहराया गया, डेवलपर जॉन कार्मैक की टिप्पणियों सहित।

जीथब के प्रवक्ता कोल गैरी ने टिप्पणी करने से इनकार कर दिया और कंपनी के मौजूदा एफएक्यू को कोपिलॉट वेबसाइट पर संदर्भित करने के लिए संतुष्ट थे, जो स्वीकार करता है कि टूल आपके प्रशिक्षण डेटा से टेक्स्ट स्निपेट का उत्पादन कर सकता है।

यह लगभग 0.1% समय होता है, GitHub के अनुसार, आमतौर पर जब उपयोगकर्ता अपने अनुरोधों के आसपास पर्याप्त संदर्भ प्रदान नहीं करते हैं या जब समस्या का एक तुच्छ समाधान होता है।

"हम वास्तविक समय में अच्छे निर्णय लेने में आपकी सहायता करने के लिए सभी प्रशिक्षण डेटा में कोड दोहराने के दुर्लभ उदाहरणों का पता लगाने के लिए एक मूल ट्रैकिंग सिस्टम को लागू करने की प्रक्रिया में हैं। GitHub Copilot सुझावों के बारे में, ”कंपनी के अक्सर पूछे जाने वाले प्रश्न कहते हैं.

इस बीच, गिटहब के सीईओ नेट फ्रीडमैन ने तर्क दिया कि सार्वजनिक डेटा पर प्रशिक्षण मशीन लर्निंग सिस्टम एक वैध उपयोग है, जबकि यह स्वीकार करते हुए कि "बौद्धिक संपदा और कृत्रिम बुद्धि एक दिलचस्प राजनीतिक चर्चा का विषय होगा।" जिसमें कंपनी सक्रिय रूप से भाग लेगी।

अपने एक ट्वीट में उन्होंने लिखा:

"GitHub Copilot, अपने स्वयं के प्रवेश द्वारा, GPL कोड के पहाड़ों पर बनाया गया था, इसलिए मुझे यकीन नहीं है कि यह मनी लॉन्ड्रिंग का एक रूप नहीं है। व्यावसायिक कार्यों में ओपन सोर्स कोड। वाक्यांश "आमतौर पर सटीक टुकड़ों को पुन: पेश नहीं करता है" बहुत संतोषजनक नहीं है "।

“कॉपीराइट केवल कॉपी और पेस्ट को कवर नहीं करता है; व्युत्पन्न कार्यों को शामिल करता है। GitHub Copilot को ओपन सोर्स कोड पर बनाया गया था और आप जो कुछ भी जानते हैं उसका कुल योग उस कोड से लिया गया है। 'व्युत्पन्न' शब्द की कोई संभावित व्याख्या नहीं है जिसमें यह शामिल नहीं है, 'उन्होंने लिखा। "एआई की पुरानी पीढ़ी को सार्वजनिक ग्रंथों और तस्वीरों में प्रशिक्षित किया गया था, जिस पर कॉपीराइट का दावा करना अधिक कठिन है, लेकिन यह अदालतों द्वारा परीक्षण किए गए बहुत स्पष्ट लाइसेंस के साथ महान कार्यों से लिया गया है, इसलिए मैं अपरिहार्य / सामूहिक के लिए तत्पर हूं / इस पर बड़े पैमाने पर कार्रवाई ”।

अंत में, हमें कॉपिलॉट को प्रशिक्षित करने के तरीके को संशोधित करने के लिए गिटहब द्वारा उठाए जाने वाले कार्यों की प्रतीक्षा करनी होगी, क्योंकि अंत में, जल्दी या बाद में जिस तरह से यह कोड उत्पन्न करता है वह एक से अधिक डेवलपर को परेशानी में डाल सकता है।


अपनी टिप्पणी दर्ज करें

आपका ईमेल पता प्रकाशित नहीं किया जाएगा। आवश्यक फ़ील्ड के साथ चिह्नित कर रहे हैं *

*

*

  1. डेटा के लिए जिम्मेदार: मिगुएल elngel Gatón
  2. डेटा का उद्देश्य: नियंत्रण स्पैम, टिप्पणी प्रबंधन।
  3. वैधता: आपकी सहमति
  4. डेटा का संचार: डेटा को कानूनी बाध्यता को छोड़कर तीसरे पक्ष को संचार नहीं किया जाएगा।
  5. डेटा संग्रहण: ऑकेंटस नेटवर्क्स (EU) द्वारा होस्ट किया गया डेटाबेस
  6. अधिकार: किसी भी समय आप अपनी जानकारी को सीमित, पुनर्प्राप्त और हटा सकते हैं।