StableLM at idinisenyo upang mahusay na makabuo ng teksto at code
Inilabas ang balita na Stability AI, ang kumpanya sa likod ng Stable Diffusion imaging AI model, ay inihayag ang una sa hanay nito ng mga modelo ng wika ng StableLM.
Gamit ito Inaasahan ng Stability na gayahin ang mga epekto ng open source na modelo ng synthesis ng imahe Matatag na Pagsasabog, na inilabas noong 2022. Sa pagpipino, maaaring gamitin ang StableLM upang bumuo ng open source na alternatibo sa ChatGPT.
Para sa mga hindi pamilyar sa Stability AI, dapat mong malaman na ito ay isang kumpanyang nakabase sa London na nagpoposisyon sa sarili bilang isang open source na karibal sa OpenAI, isang kumpanya na bumuo ng makapangyarihan ngunit pagmamay-ari na mga modelo ng artipisyal na wika gaya ng ChatGPT.
Tungkol sa StableLM
StableLM ay ang pangalan ng pamilya ng mga modelo ng artipisyal na wika na nilikha ng Stability AI, na magagamit bilang open source sa GitHub sa ilalim ng lisensyang Creative Commons BY-SA-4.0. Ang StableLM ay isang modelo ng pagbuo ng teksto na maaaring bumuo ng teksto ng tao at magsulat ng mga programa sa pamamagitan ng paghula sa susunod na salita sa isang pagkakasunud-sunod. Gumagamit ito ng pamamaraan na tinatawag na "chip prediction" na kinabibilangan ng paghula sa susunod na fragment ng salita mula sa kontekstong ibinigay ng isang tao sa anyo ng isang "pahiwatig".
Tulad ng ibang "maliit" na LLM Sinasabi ng StableLM na nakakamit ang katulad na pagganap sa modelo ng sangguniang GPT-3 ng OpenAI habang gumagamit ng mas kaunting pangkalahatang parameter (7 bilyon para sa StableLM kumpara sa 175 bilyon para sa GPT-3).
Ang paglabas ng StableLM ay bubuo sa aming karanasan sa mga dating open source na modelo ng wika kasama ang EleutherAI, isang non-profit na sentro ng pananaliksik. Kasama sa mga modelo ng wikang ito ang GPT-J, GPT-NeoX, at ang Pythia suite, na sinanay sa open source na dataset na The Pile.
StableLM sinasabing may katulad na pagganap sa GPT-3, ang modelo ng wika na nagpapagana sa ChatGPT, habang gumagamit ng mas kaunting mga parameter (7 bilyon kumpara sa 175 bilyon). Ang mga parameter ay mga variable na ginagamit ng modelo upang matuto mula sa data ng pagsasanay. Ang pagkakaroon ng mas kaunting mga parameter ay ginagawang mas maliit at mas mahusay ang modelo, na maaaring gawing mas madaling tumakbo sa mga lokal na device tulad ng mga smartphone at laptop.
StableLM sinanay sa isang bagong dataset batay sa The Pile, naglalaman ng 1,5 trilyong token, na halos 3 beses ang laki ng The Pile. Ang Pile ay isang mataas na kalidad at magkakaibang dataset para sa pagsasanay ng mga modelo ng wika.
Binanggit ng Stability AI na available na ang mga template sa repositoryo ng GitHub at paparating na ang isang buong puting papel, at inaasahan ang patuloy na pakikipagtulungan sa mga developer at mananaliksik habang inilalabas nito ang StableLM suite.
Bilang karagdagan, binanggit nila ang paglulunsad ng RLHF open collaboration program at pakikipagtulungan sa mga pagsisikap ng komunidad tulad ng Open Assistant upang lumikha ng isang open source na dataset para sa mga AI assistant.
Huling ngunit hindi huli, Sa pagsasalita tungkol sa mga release ng Stability AI, maaari rin nating i-highlight na inanunsyo nito ang beta release ng SDXL (na nangangahulugang Stable Diffusion Extra Large), isang bagong modelo ng artificial intelligence na may kakayahang bumuo ng mga larawan mula sa mga textual na paglalarawan. Ang SDXL ay ang pinakabagong karagdagan sa Stable Diffusion suite, na kinabibilangan din ng mga modelo ng SD, SDT, at SDC.
Ang SDXL ay naiiba sa iba pang mga modelo sa laki at kakayahan nito. Sa 2300 bilyong mga parameter, ang SDXL ay higit sa 2,5 beses na mas malaki kaysa sa orihinal na modelo ng SD, na mayroon lamang 890 milyon. Ang mga karagdagang parameter na ito ay nagbibigay-daan sa SDXL na makabuo ng mga larawang mas mahusay na sumusunod sa mga kumplikadong pattern. Halimbawa, ang SDXL ay maaaring gumawa ng nababasang teksto sa mga larawan o lumikha ng mga kapansin-pansing makatotohanang larawan ng mga kathang-isip na karakter.
Ang SDXL ay kasalukuyang nasa beta sa DreamStudio at iba pang sikat na imaging application gaya ng NightCafe Creator. Tulad ng lahat ng modelo ng Stability AI, malapit nang ilabas ang SDXL bilang open source para sa pinakamainam na accessibility. Inanunsyo ng Stability AI na ang SDXL ay may pahintulot na lisensyado para sa komersyal at hindi pangkomersyal na paggamit, hangga't sinusunod mo ang mga etikal at legal na alituntunin.
Panghuli, kung interesado kang malaman ang tungkol dito, maaari kang kumunsulta sa mga detalye Sa sumusunod na link.