StableLM, odprtokodna alternativa ChatGPT

StableLM

StableLM in je zasnovan za učinkovito ustvarjanje besedila in kode

To je bila objavljena novica Stabilnost AI, podjetje, ki stoji za modelom Stable Diffusion imaging AI, je objavil prvi iz svojega nabora jezikovnih modelov StableLM.

S tem Stability upa, da bo ponovil učinke svojega odprtokodnega modela sinteze slike Stabilna difuzija, izdan leta 2022. Z izpopolnitvijo bi lahko StableLM uporabili za izdelavo odprtokodne alternative ChatGPT.

Za tiste, ki niste seznanjeni s Stability AI, morate vedeti, da je to podjetje s sedežem v Londonu, ki se postavlja kot odprtokodni tekmec OpenAI, podjetju, ki razvija močne, a lastniške umetne jezikovne modele, kot je ChatGPT.

O StableLM

StableLM je ime družine umetnih jezikovnih modelov, ki jih je ustvaril Stability AI, ki so na voljo kot odprtokodni na GitHubu pod licenco Creative Commons BY-SA-4.0StableLM je model za generiranje besedila ki lahko sestavlja človeško besedilo in piše programe s predvidevanjem naslednje besede v zaporedju. Uporablja tehniko, imenovano "chip prediction" ki vključuje ugibanje naslednjega besednega odlomka iz konteksta, ki ga poda človek v obliki »namiga«.

Kot drugi "majhni" LLM StableLM trdi, da dosega podobno zmogljivost kot referenčni model GPT-3 OpenAI, medtem ko uporablja veliko manj splošnih parametrov (7 milijard za StableLM v primerjavi s 175 milijardami za GPT-3).

Izdaja StableLM temelji na naših izkušnjah s prejšnjimi odprtokodnimi jezikovnimi modeli z EleutherAI, neprofitnim raziskovalnim centrom. Ti jezikovni modeli vključujejo GPT-J, GPT-NeoX in zbirko Pythia, ki so bili usposobljeni na odprtokodnem naboru podatkov The Pile.

StableLM trdi, da ima podobno zmogljivost kot GPT-3, jezikovni model, ki poganja ChatGPT, medtem ko uporablja veliko manj parametrov (7 milijard v primerjavi s 175 milijardami). Parametri so spremenljivke, ki jih model uporablja za učenje iz podatkov o usposabljanju. Zaradi manj parametrov je model manjši in učinkovitejši, kar lahko olajša delovanje na lokalnih napravah, kot so pametni telefoni in prenosniki.

StableLM usposobljeni za nov nabor podatkov, ki temelji na The Pile, ki vsebuje 1,5 bilijona žetonov, kar je približno 3-krat večja od velikosti The Pile. Pile je visokokakovosten in raznolik nabor podatkov za usposabljanje jezikovnih modelov.

Stability AI omenja, da so predloge že na voljo v repozitoriju GitHub in da bo kmalu na voljo popolna bela knjiga, ter se veseli nadaljnjega sodelovanja z razvijalci in raziskovalci, ko uvaja zbirko StableLM.

Poleg tega omenjajo začetek programa odprtega sodelovanja RLHF in sodelovanje s prizadevanji skupnosti, kot je Open Assistant, za ustvarjanje odprtokodnega nabora podatkov za pomočnike AI.

Nenazadnje, Ko že govorimo o izdajah Stability AI, lahko poudarimo tudi, da je napovedal izdaja beta SDXL (kar pomeni Stable Diffusion Extra Large), nov model umetne inteligence, ki je sposoben generirati slike iz besedilnih opisov. SDXL je najnovejši dodatek k paketu Stable Diffusion, ki vključuje tudi modele SD, SDT in SDC.

SDXL se od ostalih modelov razlikuje po velikosti in zmogljivostih. Z 2300 milijarde parametrov je SDXL več kot 2,5-krat večji od originalnega modela SD, ki je imel le 890 milijonov. Ti dodatni parametri omogočajo SDXL ustvarjanje slik, ki se bolje držijo kompleksnih vzorcev. SDXL lahko na primer ustvari berljivo besedilo na slikah ali ustvari osupljivo realistične portrete izmišljenih likov.

SDXL je trenutno v različici beta v DreamStudio in drugih priljubljenih aplikacijah za slikanje, kot je NightCafe Creator. Kot vsi modeli stabilnosti AI bo tudi SDXL kmalu izdan kot odprtokoden za optimalno dostopnost. Stabilnost AI oznanja, da ima SDXL dovoljeno licenco za komercialno in nekomercialno uporabo, če upoštevate etične in pravne smernice.

Nazadnje, če vas zanima več o tem, se lahko posvetujete s podrobnostmi V naslednji povezavi.