StableLM, open source alternatíva k ChatGPT

StabilnýLM

StableLM a je navrhnutý tak, aby efektívne generoval text a kód

Správa bola zverejnená, že Stabilita AI, spoločnosť, ktorá stojí za modelom AI zobrazovania Stable Diffusion, oznámila prvý zo svojej sady jazykových modelov StableLM.

S tým Stability dúfa, že zopakuje účinky svojho modelu syntézy obrázkov s otvoreným zdrojovým kódom Stabilná difúzia, vydaný v roku 2022. S vylepšením by sa StableLM mohol použiť na zostavenie open source alternatívy k ChatGPT.

Pre tých, ktorí nepoznajú Stability AI, mali by ste vedieť, že ide o spoločnosť so sídlom v Londýne, ktorá sa stavia ako open source rival OpenAI, spoločnosti, ktorá vyvíja výkonné, ale vlastné modely umelých jazykov, ako je ChatGPT.

O StableLM

StabilnýLM je názov rodiny umelých jazykových modelov vytvorených pomocou Stability AI, ktoré sú dostupné ako open source na GitHub pod licenciou Creative Commons BY-SA-4.0StableLM je model generovania textu ktorý dokáže skladať ľudský text a písať programy predpovedaním ďalšieho slova v poradí. Používa techniku ​​nazývanú „predikcia čipu“ čo zahŕňa uhádnutie ďalšieho slovného fragmentu z kontextu poskytnutého človekom vo forme „nápovedy“.

Rovnako ako ostatné „malé“ LLM StableLM tvrdí, že dosahuje podobný výkon ako referenčný model GPT-3 OpenAI pri použití oveľa menšieho počtu všeobecných parametrov (7 miliárd pre StableLM vs. 175 miliárd pre GPT-3).

Vydanie StableLM stavia na našich skúsenostiach s predchádzajúcimi modelmi jazyka s otvoreným zdrojovým kódom s EleutherAI, neziskovým výskumným centrom. Tieto jazykové modely zahŕňajú GPT-J, GPT-NeoX a balík Pythia, ktoré boli trénované na množine údajov s otvoreným zdrojom The Pile.

StabilnýLM tvrdí, že má podobný výkon ako GPT-3, jazykový model, ktorý poháňa ChatGPT, pričom používa oveľa menej parametrov (7 miliárd vs. 175 miliárd). Parametre sú premenné, ktoré model používa na učenie sa z trénovacích údajov. Vďaka menšiemu počtu parametrov je model menší a efektívnejší, čo môže uľahčiť spustenie na lokálnych zariadeniach, ako sú smartfóny a notebooky.

StabilnýLM vyškolení na novom súbore údajov založených na The Pile, obsahuje 1,5 bilióna žetónov, čo je asi 3-krát väčšia veľkosť ako The Pile. The Pile je vysokokvalitný a rôznorodý súbor údajov pre trénovanie jazykových modelov.

Stability AI spomína, že šablóny sú už dostupné v úložisku GitHub a že čoskoro bude k dispozícii kompletná biela kniha, a teší sa na pokračovanie spolupráce s vývojármi a výskumníkmi pri zavádzaní balíka StableLM.

Okrem toho spomínajú spustenie programu otvorenej spolupráce RLHF a spoluprácu s komunitnými snahami, ako je Open Assistant, s cieľom vytvoriť súbor údajov s otvoreným zdrojom pre asistentov AI.

V neposlednom rade, Keď už hovoríme o vydaniach Stability AI, môžeme tiež zdôrazniť, že to oznámilo beta vydanie SDXL (čo znamená Stable Diffusion Extra Large), nový model umelej inteligencie schopný generovať obrázky z textových popisov. SDXL je najnovším prírastkom do balíka Stable Diffusion, ktorý zahŕňa aj modely SD, SDT a SDC.

SDXL sa od ostatných modelov líši veľkosťou a možnosťami. S 2300 miliardami parametrov je SDXL viac ako 2,5-krát väčší ako pôvodný SD model, ktorý mal len 890 miliónov. Tieto dodatočné parametre umožňujú SDXL generovať obrázky, ktoré lepšie priľnú ku komplexným vzorom. SDXL môže napríklad vytvárať čitateľný text na obrázkoch alebo vytvárať nápadne realistické portréty fiktívnych postáv.

SDXL je momentálne vo verzii beta v programe DreamStudio a ďalších populárnych zobrazovacích aplikáciách, ako je napríklad NightCafe Creator. Rovnako ako všetky modely Stability AI, aj SDXL bude čoskoro vydaný ako open source pre optimálnu dostupnosť. Stability AI oznamuje, že SDXL je povolená licencia na komerčné a nekomerčné použitie, pokiaľ budete dodržiavať etické a právne pokyny.

Nakoniec, ak máte záujem dozvedieť sa o tom viac, môžete sa obrátiť na podrobnosti Na nasledujúcom odkaze.