Copilot ผู้ช่วย AI ของ GitHub ได้รับการวิพากษ์วิจารณ์อย่างหนักจากชุมชนโอเพ่นซอร์ส

บางวันที่ผ่านมา เราแบ่งปันที่นี่ในบล็อกข่าวของ Copilotซึ่งเป็นวิซาร์ดปัญญาประดิษฐ์สำหรับเขียนโค้ด GitHub และโดยทั่วไปฉันจะนำเสนอเป็นเครื่องมือช่วยเหลือสำหรับโปรแกรมเมอร์

แม้ว่านักบิน แตกต่างจากระบบการเติมโค้ดให้สมบูรณ์ ดั้งเดิมสำหรับความสามารถในการสร้างบล็อคโค้ดที่ค่อนข้างซับซ้อน จนถึงฟังก์ชันพร้อมใช้งานที่สังเคราะห์ขึ้นโดยคำนึงถึงบริบทปัจจุบัน เช่น Copilot คือฟังก์ชัน AI ที่เรียนรู้ผ่านโค้ดหลายล้านบรรทัด และรับรู้สิ่งที่คุณกำลังวางแผนตามคำจำกัดความของฟังก์ชัน ฯลฯ

ในขณะที่ นักบินเป็นตัวแทนของการประหยัดเวลาที่ยอดเยี่ยม save เนื่องจากการเรียนรู้โค้ดหลายล้านบรรทัด ซึ่งเริ่มสร้างความกลัวว่าเครื่องมือนี้จะหลีกเลี่ยงข้อกำหนดสิทธิ์การใช้งานโอเพนซอร์สและละเมิดกฎหมายลิขสิทธิ์

Armin Ronacher นักพัฒนาชื่อดัง ในชุมชนโอเพ่นซอร์ส เขาเป็นหนึ่งในนักพัฒนาที่ ผิดหวังกับวิธีการสร้างนักบิน ในขณะที่เขาบอกว่าเขาทดลองกับเครื่องมือและโพสต์ภาพหน้าจอบน Twitter ซึ่ง บอกว่าเขารู้สึกแปลกที่นักบิน เครื่องมือปัญญาประดิษฐ์ที่จำหน่ายในเชิงพาณิชย์ สามารถผลิตรหัสลิขสิทธิ์

ด้วยเหตุนี้ นักพัฒนาบางคนจึงเริ่มตื่นตระหนก สำหรับการใช้รหัสสาธารณะเพื่อฝึกปัญญาประดิษฐ์ของเครื่องมือ ข้อกังวลประการหนึ่งคือหาก Copilot ทำซ้ำโค้ดที่มีอยู่จำนวนมาก อาจละเมิดลิขสิทธิ์หรือฟอกโค้ดโอเพนซอร์สเพื่อใช้ในเชิงพาณิชย์โดยไม่ต้องมีใบอนุญาตที่เหมาะสม (โดยทั่วไปคือดาบสองคม)

นอกจากนี้ ปรากฏว่าเครื่องมือนี้ยังสามารถใส่ข้อมูลส่วนบุคคลได้อีกด้วย เผยแพร่โดยนักพัฒนาและในกรณีหนึ่ง จำลองรหัสที่อ้างถึงอย่างกว้างขวางจากเกมพีซีปี 1999 Quake III Arena รวมถึงความคิดเห็นจากนักพัฒนา John Carmack

Cole Garry โฆษกของ Github ปฏิเสธที่จะแสดงความคิดเห็นและยินดีที่จะอ้างถึงคำถามที่พบบ่อยที่มีอยู่ของบริษัทบนเว็บไซต์ Copilot ซึ่งรับทราบว่าเครื่องมือนี้สามารถสร้างตัวอย่างข้อความจากข้อมูลการฝึกอบรมของคุณได้

สิ่งนี้เกิดขึ้นประมาณ 0.1% ของเวลาตาม GitHub โดยปกติเมื่อผู้ใช้ไม่ได้ให้บริบทเพียงพอเกี่ยวกับคำขอของพวกเขาหรือเมื่อปัญหามีวิธีแก้ปัญหาเล็กน้อย

“เรากำลังดำเนินการติดตั้งระบบติดตามต้นทางเพื่อตรวจจับโค้ดที่หายากซึ่งเกิดขึ้นซ้ำในข้อมูลการฝึกอบรมทั้งหมด เพื่อช่วยให้คุณตัดสินใจได้ดีในแบบเรียลไทม์ เกี่ยวกับคำแนะนำ GitHub Copilot” คำถามที่พบบ่อยของ บริษัท.

ในขณะเดียวกัน Nat Friedman ซีอีโอของ GitHub แย้งว่าการฝึกอบรมระบบการเรียนรู้ของเครื่องเกี่ยวกับข้อมูลสาธารณะนั้นเป็นการใช้งานที่ถูกต้องตามกฎหมาย ในขณะที่ยอมรับว่า "ทรัพย์สินทางปัญญาและปัญญาประดิษฐ์จะเป็นหัวข้อของการอภิปรายทางการเมืองที่น่าสนใจ" ซึ่งบริษัทจะมีส่วนร่วมอย่างจริงจัง

ในทวีตหนึ่งของเขา เขาเขียนว่า:

“GitHub Copilot ถูกสร้างขึ้นบนภูเขาของรหัส GPL ดังนั้นฉันไม่แน่ใจว่านี่ไม่ใช่รูปแบบการฟอกเงินอย่างไร โอเพ่นซอร์สโค้ดในงานเชิงพาณิชย์ วลี "มักจะไม่ทำซ้ำชิ้นส่วนที่แน่นอน" ไม่น่าพอใจมาก "

“ลิขสิทธิ์ไม่เพียงแต่ครอบคลุมการคัดลอกและวางเท่านั้น ครอบคลุมงานลอกเลียนแบบ GitHub Copilot สร้างขึ้นจากโอเพ่นซอร์สโค้ด และผลรวมของทุกสิ่งที่คุณรู้นั้นนำมาจากโค้ดนั้น ไม่มีการตีความคำว่า 'ได้มา' ที่ไม่รวมสิ่งนี้ 'เขาเขียน' “ AI รุ่นเก่าได้รับการฝึกฝนในข้อความและภาพถ่ายสาธารณะซึ่งยากต่อการเรียกร้องลิขสิทธิ์ แต่อันนี้มาจากผลงานที่ยอดเยี่ยมพร้อมใบอนุญาตที่ชัดเจนมากที่ทดสอบโดยศาลดังนั้นฉันจึงหวังว่าจะหลีกเลี่ยงไม่ได้ / รวม / การกระทำครั้งใหญ่ในเรื่องนี้”

สุดท้าย เราต้องรอการดำเนินการที่ GitHub จะดำเนินการเพื่อปรับเปลี่ยนวิธีการฝึกอบรม Copilot เนื่องจากในท้ายที่สุด วิธีการสร้างโค้ดนั้นไม่ช้าก็เร็วอาจทำให้นักพัฒนาซอฟต์แวร์มากกว่าหนึ่งรายประสบปัญหาได้


แสดงความคิดเห็นของคุณ

อีเมล์ของคุณจะไม่ถูกเผยแพร่ ช่องที่ต้องการถูกทำเครื่องหมายด้วย *

*

*

  1. ผู้รับผิดชอบข้อมูล: Miguel ÁngelGatón
  2. วัตถุประสงค์ของข้อมูล: ควบคุมสแปมการจัดการความคิดเห็น
  3. ถูกต้องตามกฎหมาย: ความยินยอมของคุณ
  4. การสื่อสารข้อมูล: ข้อมูลจะไม่ถูกสื่อสารไปยังบุคคลที่สามยกเว้นตามข้อผูกพันทางกฎหมาย
  5. การจัดเก็บข้อมูล: ฐานข้อมูลที่โฮสต์โดย Occentus Networks (EU)
  6. สิทธิ์: คุณสามารถ จำกัด กู้คืนและลบข้อมูลของคุณได้ตลอดเวลา