StableLM, avatud lähtekoodiga alternatiiv ChatGPT-le

StabiilneLM

StableLM ja on loodud tõhusalt teksti ja koodi genereerimiseks

Uudis avaldati, et Stabiilsus AI, Stabiilse difusiooni kujutise AI mudeli taga olev ettevõte, teatas esimesest StableLM-i keelemudelite komplektist.

Sellega Stabiilsus loodab korrata oma avatud lähtekoodiga kujutiste sünteesimudeli mõju Stabiilne difusioon, ilmus 2022. aastal. Täiustamisega saab StableLM-i kasutada ChatGPT-le avatud lähtekoodiga alternatiivi loomiseks.

Need, kes ei tunne stabiilsuse AI-d, peaksid teadma, et see on Londonis asuv ettevõte, mis positsioneerib end avatud lähtekoodiga rivaalina OpenAI-le, ettevõttele, mis arendab võimsaid, kuid patenteeritud tehiskeele mudeleid, nagu ChatGPT.

StableLM-i kohta

StabiilneLM on Stability AI loodud tehiskeele mudelite perekonna nimi, mis on saadaval avatud lähtekoodiga GitHubis Creative Commons BY-SA-4.0 litsentsi aluselStableLM on teksti genereerimise mudel mis suudab koostada inimteksti ja kirjutada programme, ennustades järjest järgmist sõna. See kasutab tehnikat, mida nimetatakse "kiibi ennustamiseks" mis hõlmab inimese antud kontekstist järgmise sõnafragmendi äraarvamist “vihje” kujul.

Nagu teisedki "väikesed" LLM-id StableLM väidab, et saavutab GPT-3 võrdlusmudeliga sarnase jõudluse kasutades palju vähem üldisi parameetreid (7 miljardit StableLM vs. 175 miljardit GPT-3 puhul).

StableLM-i väljalaskmine põhineb meie kogemustel varasemate avatud lähtekoodiga keelemudelitega mittetulundusliku uurimiskeskuse EleutherAI-ga. Nende keelemudelite hulka kuuluvad GPT-J, GPT-NeoX ja Pythia komplekt, mida õpetati avatud lähtekoodiga andmestiku The Pile põhjal.

StabiilneLM väidab, et tal on GPT-3-ga sarnane jõudlus, keelemudel, mis toidab ChatGPT-d, kasutades samas palju vähem parameetreid (7 miljardit vs. 175 miljardit). Parameetrid on muutujad, mida mudel kasutab treeningandmetest õppimiseks. Vähem parameetreid muudab mudeli väiksemaks ja tõhusamaks, mis võib hõlbustada kohalikes seadmetes (nt nutitelefonid ja sülearvutid) töötamist.

StabiilneLM koolitatud uue andmestiku põhjal, mis põhineb The Pile'il, sisaldab 1,5 triljonit žetoone, mis on umbes 3 korda suurem kui The Pile. Pile on kvaliteetne ja mitmekesine andmestik keelemudelite treenimiseks.

Stabiilsuse AI mainib, et mallid on GitHubi hoidlas juba saadaval ja peagi on ilmumas täielik valge raamat, ning loodab jätkata koostööd arendajate ja teadlastega StableLM-i komplekti väljalaskmisel.

Lisaks mainivad nad RLHF avatud koostööprogrammi käivitamist ja koostööd kogukonna jõupingutustega, nagu Open Assistant, et luua AI-assistentide jaoks avatud lähtekoodiga andmestik.

Last but not least Stabiilsuse AI väljalasetest rääkides võime ka esile tõsta, et see teatas aasta beetaversioon SDXL (mis tähistab Stable Diffusion Extra Large), uus tehisintellekti mudel, mis suudab luua pilte tekstiliste kirjelduste põhjal. SDXL on Stable Diffusion komplekti uusim täiendus, mis sisaldab ka SD, SDT ja SDC mudeleid.

SDXL erineb teistest mudelitest oma suuruse ja võimaluste poolest. 2300 miljardi parameetriga on SDXL enam kui 2,5 korda suurem kui algne SD-mudel, millel oli vaid 890 miljonit. Need lisaparameetrid võimaldavad SDXL-il luua kujutisi, mis sobivad paremini keerukate mustritega. Näiteks võib SDXL toota piltidele loetavat teksti või luua väljamõeldud tegelaste silmatorkavalt realistlikke portreesid.

SDXL on praegu DreamStudio ja teiste populaarsete pildirakenduste, näiteks NightCafe Creatori beetaversioonis. Nagu kõik Stability AI mudelid, avaldatakse SDXL peagi avatud lähtekoodiga optimaalse juurdepääsetavuse tagamiseks. Stabiilsus-AI teatab, et SDXL-l on lubatud litsents äriliseks ja mitteäriliseks kasutamiseks, kui järgite eetilisi ja juriidilisi juhiseid.

Lõpuks, kui olete huvitatud sellest rohkem teada saama, saate üksikasju vaadata Järgmisel lingil.