StableLM a je navržen tak, aby efektivně generoval text a kód
Zpráva byla zveřejněna, že Stabilita AI, společnost stojící za modelem Stable Diffusion imaging AI, oznámila první ze své sady jazykových modelů StableLM.
S tím Stability doufá, že zopakuje účinky svého modelu syntézy obrázků s otevřeným zdrojovým kódem Stabilní difúze, vydané v roce 2022. S vylepšením by bylo možné StableLM použít k vytvoření open source alternativy k ChatGPT.
Pro ty, kteří neznají Stability AI, měli byste vědět, že se jedná o společnost se sídlem v Londýně, která se staví jako open source rival OpenAI, společnosti, která vyvíjí výkonné, ale proprietární modely umělých jazyků, jako je ChatGPT.
O StableLM
StabilníLM je název rodiny umělých jazykových modelů vytvořených Stability AI, které jsou dostupné jako open source na GitHubu pod licencí Creative Commons BY-SA-4.0. StableLM je model generování textu který dokáže skládat lidský text a psát programy předpovídáním dalšího slova v sekvenci. Využívá techniku zvanou „čipová predikce“ což zahrnuje uhodnutí dalšího slovního fragmentu z kontextu poskytnutého člověkem ve formě „nápovědy“.
Stejně jako ostatní „malé“ LLM StableLM tvrdí, že dosahuje podobného výkonu jako referenční model GPT-3 OpenAI při použití mnohem méně obecných parametrů (7 miliard pro StableLM vs. 175 miliard pro GPT-3).
Vydání StableLM staví na našich zkušenostech s předchozími open source jazykovými modely s EleutherAI, neziskovým výzkumným centrem. Tyto jazykové modely zahrnují GPT-J, GPT-NeoX a sadu Pythia, které byly trénovány na open source datové sadě The Pile.
StabilníLM tvrdí, že má podobný výkon jako GPT-3, jazykový model, který pohání ChatGPT, přičemž využívá mnohem méně parametrů (7 miliard oproti 175 miliardám). Parametry jsou proměnné, které model používá k učení z trénovacích dat. Díky menšímu počtu parametrů je model menší a efektivnější, což může usnadnit provoz na místních zařízeních, jako jsou smartphony a notebooky.
StabilníLM vyškoleni na novém datovém souboru založeném na The Pile, obsahující 1,5 bilionu žetonů, což je asi trojnásobek velikosti The Pile. The Pile je vysoce kvalitní a různorodá datová sada pro trénink jazykových modelů.
Stability AI zmiňuje, že šablony jsou již k dispozici v úložišti GitHub a že brzy bude k dispozici kompletní white paper, a těší se na pokračování spolupráce s vývojáři a výzkumníky při zavádění sady StableLM.
Kromě toho zmiňují spuštění programu otevřené spolupráce RLHF a spolupráci s komunitními snahami, jako je Open Assistant, na vytvoření open source datové sady pro asistenty AI.
V neposlední řadě, Když už mluvíme o vydáních Stability AI, můžeme také zdůraznit, že bylo oznámeno beta vydání SDXL (což je zkratka pro Stable Diffusion Extra Large), nový model umělé inteligence schopný generovat obrázky z textových popisů. SDXL je nejnovějším přírůstkem do sady Stable Diffusion, která také zahrnuje modely SD, SDT a SDC.
SDXL se od ostatních modelů liší velikostí a možnostmi. S 2300 miliardami parametrů je SDXL více než 2,5krát větší než původní SD model, který měl pouhých 890 milionů. Tyto dodatečné parametry umožňují SDXL generovat obrázky, které lépe přilnou ke složitým vzorům. SDXL může například vytvářet čitelný text na obrázcích nebo vytvářet nápadně realistické portréty fiktivních postav.
SDXL je v současné době ve verzi beta v aplikaci DreamStudio a dalších populárních zobrazovacích aplikacích, jako je NightCafe Creator. Stejně jako všechny modely Stability AI bude SDXL brzy uvolněn jako open source pro optimální dostupnost. Stability AI oznamuje, že SDXL má povolenou licenci pro komerční i nekomerční použití, pokud budete dodržovat etické a právní pokyny.
Konečně, pokud máte zájem dozvědět se o tom více, můžete konzultovat podrobnosti Na následujícím odkazu.