StableLM, a ChatGPT nyílt forráskódú alternatívája

StableLM

StableLM, és úgy lett kialakítva, hogy hatékonyan generáljon szöveget és kódot

Kiadták a hírt, hogy Stabilitás AI, a Stable Diffusion imaging AI modell mögött álló cég, bejelentette az elsőt a StableLM nyelvi modelljei közül.

Azzal A Stability azt reméli, hogy megismétli nyílt forráskódú képszintézis modelljének hatásait Stabil diffúzióFinomítással a StableLM használható nyílt forráskódú alternatíva létrehozására a ChatGPT-hez.

Azok számára, akik nem ismerik a Stability AI-t, tudniuk kell, hogy ez egy londoni székhelyű vállalat, amely nyílt forráskódú riválisaként pozicionálja magát az OpenAI-val, egy olyan vállalattal, amely olyan hatékony, de szabadalmaztatott mesterséges nyelvi modelleket fejleszt, mint például a ChatGPT.

A StableLM-ről

StableLM a Stability AI által létrehozott mesterséges nyelvi modellek családjának neve, amelyek nyílt forráskódként érhetők el a GitHubon a Creative Commons BY-SA-4.0 licenc alattA StableLM egy szöveggeneráló modell amely képes emberi szöveget alkotni és programokat írni a sorozat következő szavának megjóslásával. A „chip-előrejelzés” nevű technikát használja amely magában foglalja a következő szótöredék kitalálását az ember által biztosított szövegkörnyezetből „tipp” formájában.

Mint a többi "kis" LLM-hez A StableLM azt állítja, hogy a GPT-3 referenciamodelléhez hasonló teljesítményt ér el az OpenAI-t, miközben sokkal kevesebb általános paramétert használ (7 milliárd a StableLM-nél, szemben a 175 milliárd GPT-3-mal).

A StableLM kiadása az EleutherAI non-profit kutatóközponttal szerzett korábbi nyílt forráskódú nyelvi modellekkel szerzett tapasztalatainkra épít. Ezek a nyelvi modellek közé tartozik a GPT-J, a GPT-NeoX és a Pythia programcsomag, amelyeket a The Pile nyílt forráskódú adatkészleten képeztek ki.

StableLM azt állítja, hogy a GPT-3 teljesítményéhez hasonló, a ChatGPT-t működtető nyelvi modell, miközben sokkal kevesebb paramétert használ (7 milliárd vs. 175 milliárd). A paraméterek olyan változók, amelyeket a modell arra használ, hogy tanuljon a betanítási adatokból. A kevesebb paraméterrel a modell kisebb és hatékonyabb, ami megkönnyítheti a futtatást helyi eszközökön, például okostelefonokon és laptopokon.

StableLM a The Pile-n alapuló új adatkészletre oktatott, 1,5 billió tokent tartalmaz, ami körülbelül háromszor akkora, mint a The Pile. A Pile egy kiváló minőségű és változatos adatkészlet a nyelvi modellek betanításához.

A Stability AI megemlíti, hogy a sablonok már elérhetőek a GitHub adattárban, és hamarosan megjelenik a teljes fehér könyv, és várja a fejlesztőkkel és kutatókkal való együttműködés folytatását a StableLM programcsomag bevezetése során.

Emellett megemlítik az RLHF nyílt együttműködési program elindítását, valamint az olyan közösségi erőfeszítésekkel való együttműködést, mint az Open Assistant, hogy nyílt forráskódú adatkészletet hozzanak létre az AI-asszisztensek számára.

Végül, de nem utolsó sorban, Ha már a Stabilitási AI kiadásokról beszélünk, azt is kiemelhetjük, hogy bejelentette béta kiadása SDXL (ami a Stable Diffusion Extra Large rövidítése), egy új mesterséges intelligencia modell, amely képes képeket generálni szöveges leírásokból. Az SDXL a Stable Diffusion csomag legújabb tagja, amely SD, SDT és SDC modelleket is tartalmaz.

Az SDXL méretében és képességeiben különbözik a többi modelltől. A 2300 milliárd paraméterrel az SDXL több mint 2,5-szer nagyobb, mint az eredeti SD-modell, amelynek mindössze 890 milliója volt. Ezek a kiegészítő paraméterek lehetővé teszik az SDXL számára, hogy olyan képeket generáljon, amelyek jobban tapadnak az összetett mintákhoz. Például az SDXL képes olvasható szöveget készíteni a képeken, vagy feltűnően valósághű portrékat készíteni kitalált karakterekről.

Az SDXL jelenleg béta állapotban van a DreamStudio-ban és más népszerű képalkotó alkalmazásokban, például a NightCafe Creatorban. Mint minden Stability AI modell, az SDXL is hamarosan nyílt forráskódúként jelenik meg az optimális hozzáférhetőség érdekében. A Stability AI bejelenti, hogy az SDXL kereskedelmi és nem kereskedelmi használatra engedélyezett, mindaddig, amíg betartja az etikai és jogi irányelveket.

Végül, ha többet szeretne megtudni róla, akkor tanulmányozza a részleteket A következő linken.