StableLM และได้รับการออกแบบมาเพื่อสร้างข้อความและโค้ดอย่างมีประสิทธิภาพ
ได้ข่าวว่า AI เสถียรภาพ บริษัทที่อยู่เบื้องหลังโมเดล AI การถ่ายภาพแบบ Stable Diffusionได้ประกาศชุดโมเดลภาษา StableLM ชุดแรก.
ด้วยนั่นเอง ความเสถียรหวังว่าจะทำซ้ำเอฟเฟกต์ของโมเดลการสังเคราะห์ภาพแบบโอเพ่นซอร์ส การแพร่กระจายที่เสถียรซึ่งเปิดตัวในปี 2022 ด้วยการปรับแต่ง StableLM สามารถใช้เพื่อสร้างทางเลือกโอเพ่นซอร์สแทน ChatGPT
สำหรับผู้ที่ไม่คุ้นเคยกับ Stability AI คุณควรทราบว่าบริษัทนี้เป็นบริษัทในลอนดอนที่วางตำแหน่งตัวเองเป็นคู่แข่งโอเพ่นซอร์สกับ OpenAI ซึ่งเป็นบริษัทที่พัฒนาโมเดลภาษาประดิษฐ์ที่ทรงพลังแต่เป็นกรรมสิทธิ์ เช่น ChatGPT
เกี่ยวกับ StableLM
เสถียรLM เป็นชื่อตระกูลของโมเดลภาษาประดิษฐ์ที่สร้างขึ้นโดย Stability AI ซึ่งมีอยู่เป็นโอเพ่นซอร์ส บน GitHub ภายใต้ใบอนุญาต Creative Commons BY-SA-4.0. StableLM เป็นรูปแบบการสร้างข้อความ ที่สามารถเขียนข้อความของมนุษย์และเขียนโปรแกรมโดยการทำนายคำถัดไปตามลำดับ. ใช้เทคนิคที่เรียกว่า "การทำนายชิป" ซึ่งเกี่ยวข้องกับการเดาเศษคำถัดไปจากบริบทที่มนุษย์ให้มาในรูปแบบของ "คำใบ้"
เช่นเดียวกับ LLM "ขนาดเล็ก" อื่น ๆ StableLM อ้างว่ามีประสิทธิภาพใกล้เคียงกับรุ่นอ้างอิง GPT-3 ของ OpenAI ในขณะที่ใช้พารามิเตอร์ทั่วไปน้อยกว่ามาก (7 พันล้านสำหรับ StableLM เทียบกับ 175 พันล้านสำหรับ GPT-3)
การเปิดตัว StableLM ต่อยอดจากประสบการณ์ของเรากับโมเดลภาษาโอเพ่นซอร์สก่อนหน้านี้กับ EleutherAI ซึ่งเป็นศูนย์วิจัยที่ไม่หวังผลกำไร โมเดลภาษาเหล่านี้ประกอบด้วย GPT-J, GPT-NeoX และชุด Pythia ซึ่งได้รับการฝึกฝนในชุดข้อมูลโอเพ่นซอร์ส The Pile
เสถียรLM อ้างว่ามีประสิทธิภาพใกล้เคียงกับ GPT-3 โมเดลภาษาที่สนับสนุน ChatGPT ในขณะที่ใช้พารามิเตอร์น้อยกว่ามาก (7 พันล้านเทียบกับ 175 พันล้าน) พารามิเตอร์คือตัวแปรที่โมเดลใช้เพื่อเรียนรู้จากข้อมูลการฝึกอบรม การมีพารามิเตอร์น้อยลงทำให้โมเดลมีขนาดเล็กลงและมีประสิทธิภาพมากขึ้น ซึ่งทำให้ทำงานบนอุปกรณ์ท้องถิ่น เช่น สมาร์ทโฟนและแล็ปท็อปได้ง่ายขึ้น
เสถียรLM ฝึกฝนชุดข้อมูลใหม่ตาม The Pile มีโทเค็น 1,5 ล้านล้านโทเค็นซึ่งมีขนาดประมาณ 3 เท่าของ The Pile The Pile เป็นชุดข้อมูลคุณภาพสูงและหลากหลายสำหรับการฝึกโมเดลภาษา
Stability AI ระบุว่าเทมเพลตมีอยู่แล้วในที่เก็บ GitHub และเอกสารฉบับเต็มกำลังจะมาในเร็วๆ นี้ และตั้งตารอที่จะทำงานร่วมกับนักพัฒนาและนักวิจัยต่อไปเมื่อเปิดตัวชุด StableLM
นอกจากนี้ยังกล่าวถึงการเปิดตัวโปรแกรมการทำงานร่วมกันแบบเปิดของ RLHF และการทำงานร่วมกับชุมชน เช่น Open Assistant เพื่อสร้างชุดข้อมูลโอเพ่นซอร์สสำหรับผู้ช่วย AI
สุดท้าย แต่ไม่ท้ายสุด, เมื่อพูดถึงการเปิดตัว AI ที่มีความเสถียร เรายังสามารถเน้นที่การประกาศ รุ่นเบต้าของ SDXL (ซึ่งย่อมาจาก Stable Diffusion Extra Large) โมเดลปัญญาประดิษฐ์ใหม่ที่สามารถสร้างรูปภาพจากคำอธิบายที่เป็นข้อความ SDXL เป็นส่วนเสริมล่าสุดของชุด Stable Diffusion ซึ่งรวมถึงโมเดล SD, SDT และ SDC
SDXL แตกต่างจากรุ่นอื่นในด้านขนาดและความสามารถ ด้วยพารามิเตอร์ 2300 พันล้านพารามิเตอร์ SDXL จึงมีขนาดใหญ่กว่ารุ่น SD เดิมซึ่งมีเพียง 2,5 ล้านตัวมากกว่า 890 เท่า พารามิเตอร์เพิ่มเติมเหล่านี้ช่วยให้ SDXL สร้างภาพที่ยึดตามรูปแบบที่ซับซ้อนได้ดีขึ้น ตัวอย่างเช่น SDXL สามารถสร้างข้อความที่อ่านได้บนรูปภาพหรือสร้างภาพตัวละครที่เหมือนจริงอย่างน่าทึ่ง
ปัจจุบัน SDXL อยู่ในรุ่นเบต้าใน DreamStudio และแอปพลิเคชันด้านภาพยอดนิยมอื่นๆ เช่น NightCafe Creator เช่นเดียวกับโมเดล AI ความเสถียรทั้งหมด SDXL จะเปิดตัวเป็นโอเพ่นซอร์สในเร็วๆ นี้เพื่อการเข้าถึงที่เหมาะสมที่สุด Stability AI ประกาศว่า SDXL ได้รับอนุญาตสำหรับการใช้งานเชิงพาณิชย์และไม่ใช่เชิงพาณิชย์ ตราบใดที่คุณปฏิบัติตามหลักเกณฑ์ด้านจริยธรรมและกฎหมาย
สุดท้ายนี้ หากคุณสนใจที่จะทราบข้อมูลเพิ่มเติม สามารถปรึกษารายละเอียดได้ ในลิงค์ต่อไปนี้.