Debian หารือเกี่ยวกับอนาคตของโมเดล AI ในระบบนิเวศของตน

เดเบียน-กนู-ลินุกซ์

เดเบียนมี ประกาศว่าได้มี เปิดมติทั่วไปใหม่ (GR) เพื่อให้พวกเขา นักพัฒนาตัดสินใจ ว่าโมเดล AI (ปัญญาประดิษฐ์) สามารถเป็นส่วนหนึ่งของที่เก็บข้อมูลหลักได้หรือไม่ และภายใต้เงื่อนไขใด

แม้ว่าขั้นตอนการลงคะแนนเสียงยังไม่เริ่มต้น แต่ช่วงเวลาการหารือระหว่างผู้พัฒนาโครงการได้เริ่มต้นขึ้นแล้ว ใครจะเป็นผู้ตัดสินใจและทิศทางที่ Debian จะดำเนินการเกี่ยวกับโมเดลการเรียนรู้ของเครื่อง- นักพัฒนาที่มีสิทธิ์ลงคะแนนเสียงซึ่งรับผิดชอบการบำรุงรักษาแพ็คเกจและโครงสร้างพื้นฐานโดยรวมของโครงการประมาณหนึ่งพันรายมีสิทธิ์เข้าร่วมการลงคะแนนเสียงนี้

หัวใจสำคัญของการอภิปรายคือคำถามโมเดล AI ที่เผยแพร่ภายใต้ใบอนุญาตแบบเปิดสามารถถือว่าฟรีได้จริงหรือไม่ หากไม่มีข้อมูลและเครื่องมือที่จำเป็นสำหรับการฝึกตั้งแต่เริ่มต้น ข้อเสนอ ในการอภิปรายยืนยันว่าไม่และพีอ้างว่าโมเดลเหล่านี้เข้ากันไม่ได้กับแนวทางซอฟต์แวร์ฟรีของ Debian (ดีเอฟเอสจี) หากได้รับการอนุมัติ โมเดลดังกล่าวจะถูกแยกออกจากที่เก็บข้อมูลหลัก โดยไม่พิจารณา (อย่างน้อยก็ตอนนี้) ว่าจะรวมไว้ในส่วนต่างๆ เช่น ไม่ฟรีหรือไม่

การคัดค้านชี้ให้เห็นถึงประเด็นสำคัญของซอฟต์แวร์เสรี: ความสามารถในการปรับเปลี่ยน ศึกษา และปรับปรุงโปรแกรม ในกรณีของโมเดล AI สิ่งนี้จะเป็นไปได้เฉพาะเมื่อคุณสามารถเข้าถึงข้อมูลการฝึกอบรมและเครื่องมือที่ใช้ในการสร้างได้ ผู้เสนอญัตติโต้แย้งว่าหากไม่มีองค์ประกอบเหล่านี้ การปรับเปลี่ยนรูปแบบก็เป็นไปไม่ได้ในทางปฏิบัติ แม้แต่การกระทำง่ายๆ เช่น การเปลี่ยนโทเค็นไนเซอร์เพื่อเพิ่มการรองรับภาษาใหม่ กลายเป็นงานที่ยากลำบากหากไม่สามารถทำซ้ำกระบวนการฝึกอบรมได้

ความเสี่ยงทางกฎหมายและความปลอดภัย

ความกังวลไม่ได้มีแค่เรื่องของปรัชญาและจริยธรรมในการจัดจำหน่ายเท่านั้น แต่ยังรวมถึง ผลกระทบต่อความปลอดภัยที่ร้ายแรงเกิดขึ้น ความทึบที่เกิดจากการไม่มีข้อมูลแหล่งที่มาทำให้ไม่สามารถตรวจสอบความถูกต้องตามกฎหมายของข้อมูลที่ใช้ในการฝึกอบรมได้ นี้ เปิดประตูสู่การละเมิดใบอนุญาตที่อาจเกิดขึ้นได้ ตัวอย่างเช่น หากใช้ข้อมูล GPL โดยไม่มีการระบุแหล่งที่มาอย่างถูกต้อง ทำให้ไม่สามารถระบุได้ว่าโมเดลได้รับการฝึกอบรมด้วยข้อมูลลับหรือมีลิขสิทธิ์หรือไม่

นอกจากนี้ หากไม่สามารถเข้าถึงเอกสารต้นฉบับได้ การตรวจหาข้อผิดพลาดหรือช่องโหว่ก็จะกลายเป็นงานของผู้เขียนต้นฉบับโดยเฉพาะ- ซึ่งจะเพิ่มการพึ่งพาผู้ใช้กับผู้จำหน่ายรายใดรายหนึ่ง และทำให้การติดตั้งแพตช์หรือแก้ไขปัญหามีความซับซ้อนมากขึ้น สิ่งที่แย่ไปกว่านั้น ก็คือ ทำให้ไม่สามารถตรวจสอบโมเดลได้อย่างเหมาะสม ดังนั้น แบ็คดอร์หรืออคติที่ซ่อนอยู่ในการทำงานอาจไม่ถูกสังเกตเห็น

การถกเถียงในชุมชนโอเพนซอร์ส

คำถามถึงความหมายที่แท้จริงของระบบ AI ที่ต้อง "เปิด" กำลังถูกถกเถียงอย่างเข้มข้นในระบบนิเวศซอฟต์แวร์ฟรี ไม่ใช่แค่ใน Debian เท่านั้น ในเดือนตุลาคม พ.ศ. 2023 Open Source Initiative (OSI) ได้เผยแพร่คำจำกัดความเบื้องต้น สิ่งที่ควรพิจารณาว่าเป็น AI โอเพนซอร์ส คำจำกัดความนี้ กำหนดให้ระบบ AI ต้องอนุญาตให้มีการใช้งาน ศึกษา ปรับเปลี่ยน และแจกจ่ายซ้ำได้โดยไม่มีข้อจำกัดและรวมถึงข้อกำหนดต่างๆ เช่น เอกสารประกอบที่สมบูรณ์ของแบบจำลอง ข้อมูลที่ใช้ และวิธีการฝึกอบรม

อย่างไรก็ตาม คำจำกัดความของ OSI ไม่จำเป็นต้องเผยแพร่ข้อมูลการฝึกอบรม แต่มีเพียง “ข้อมูลรายละเอียด” เกี่ยวกับพวกเขาเท่านั้น การละเว้นนี้ได้รับการวิพากษ์วิจารณ์อย่างรุนแรงจากองค์กรต่าง ๆ เช่น SFC ซึ่งโต้แย้งว่าหากไม่มีข้อมูลต้นฉบับ เสรีภาพขั้นพื้นฐานในการปรับเปลี่ยนและศึกษาก็ไม่สามารถใช้ประโยชน์ได้อย่างเต็มที่

OSI ตระหนักถึงจุดนี้ แต่ให้เหตุผลในการตัดสินใจ จากความเป็นจริงในทางปฏิบัติ: ข้อมูลจำนวนมากที่ใช้ในการฝึกโมเดลสมัยใหม่ต้องอยู่ภายใต้ใบอนุญาตเชิงพาณิชย์ มีข้อมูลที่ละเอียดอ่อน หรือไม่สามารถเผยแพร่ซ้ำได้โดยถูกต้องตามกฎหมาย พวกเขาโต้แย้งว่าการรวมข้อกำหนดที่ต้องเผยแพร่จะทำให้โมเดลที่มีอยู่ทั้งหมดเข้ากันไม่ได้กับคำจำกัดความใดๆ ของความเปิดกว้าง ส่งผลให้แนวคิดเรื่อง AI ที่เสรีอยู่ในสภาวะไร้จุดหมายที่ไม่สามารถบรรลุได้

Debian จะเลือกเส้นทางไหน?

ความละเอียด ซึ่งขณะนี้กำลังมีการหารือกันใน Debian อาจส่งผลกระทบในวงกว้างหากผ่านเนื่องจากเป็นการแสดงถึงจุดยืนที่แน่วแน่: หากไม่มีข้อมูลการฝึกอบรมหรือเครื่องมือในการจำลองแบบจำลอง ก็ไม่มีอิสระที่แท้จริง และดังนั้นจึงไม่มีตำแหน่งในเคอร์เนล Debian การตีความเสรีภาพอย่างเคร่งครัดเช่นนี้ อาจบังคับให้มีการยกเว้นโมเดลที่ใช้กันอย่างแพร่หลายจำนวนมากออกจากการจำหน่ายหลัก รวมไปถึงพัฒนาการทางวิชาการหรือธุรกิจบางส่วนที่แม้จะเผยแพร่ภายใต้ใบอนุญาตแบบเปิด แต่ก็ไม่เป็นไปตามมาตรฐานความโปร่งใสและการทำซ้ำได้นี้

การตัดสินใจของนักพัฒนา Debian อาจสร้างบรรทัดฐานให้กับซอฟต์แวร์ฟรีและกำหนดระดับมาตรฐานที่ระบบปัญญาประดิษฐ์จะต้องปฏิบัติตามเพื่อให้ถือว่าเป็นฟรีอย่างแท้จริง

สุดท้ายนี้ หากคุณคือ สนใจที่จะทราบข้อมูลเพิ่มเติมเกี่ยวกับเรื่องนี้คุณสามารถตรวจสอบรายละเอียดได้ในไฟล์ ลิงค์ต่อไปนี้