StableLM, avoimen lähdekoodin vaihtoehto ChatGPT:lle

StableLM

StableLM ja se on suunniteltu luomaan tehokkaasti tekstiä ja koodia

Uutinen julkaistiin siitä Vakaus AI, Stable Diffusion imaging AI -mallin takana oleva yritys, on julkistanut ensimmäisen StableLM-kielimalleistaan.

Sen kanssa Stability toivoo voivansa toistaa avoimen lähdekoodin kuvasynteesimallinsa vaikutukset Vakaa diffuusio, julkaistiin vuonna 2022. Jalostuksen myötä StableLM:ää voitaisiin käyttää avoimen lähdekoodin vaihtoehdon rakentamiseen ChatGPT:lle.

Niiden, jotka eivät tunne Stability AI:tä, sinun tulee tietää, että tämä on Lontoossa toimiva yritys, joka asettuu avoimen lähdekoodin kilpailijaksi OpenAI:lle, joka kehittää tehokkaita mutta omaa keinotekoista kielimalleja, kuten ChatGPT:tä.

Tietoja StableLM:stä

StableLM on Stability AI:n luoman keinotekoisten kielimallien perheen nimi, jotka ovat saatavilla avoimena lähdekoodina GitHubissa Creative Commons BY-SA-4.0 -lisenssilläStableLM on tekstin sukupolven malli joka osaa säveltää ihmistekstiä ja kirjoittaa ohjelmia ennustamalla peräkkäin seuraavan sanan. Se käyttää tekniikkaa nimeltä "sirun ennustaminen" joka sisältää seuraavan sananpalan arvaamisen ihmisen tarjoamasta kontekstista "vihjeen" muodossa.

Kuten muutkin "pienet" LLM:t StableLM väittää saavuttavansa samanlaisen suorituskyvyn kuin GPT-3-referenssimalli käyttämällä paljon vähemmän yleisiä parametreja (7 miljardia StableLM:lle vs. 175 miljardia GPT-3:lle).

StableLM:n julkaisu perustuu kokemukseemme aiemmista avoimen lähdekoodin kielimalleista voittoa tavoittelemattoman tutkimuskeskuksen EleutherAI:n kanssa. Näitä kielimalleja ovat GPT-J, GPT-NeoX ja Pythia-sarja, jotka on koulutettu avoimen lähdekoodin tietojoukossa The Pile.

StableLM väittää olevansa samanlainen suorituskyky kuin GPT-3, kielimalli, joka käyttää ChatGPT:tä, mutta käyttää paljon vähemmän parametreja (7 miljardia vs. 175 miljardia). Parametrit ovat muuttujia, joita malli käyttää oppiakseen harjoitustiedoista. Vähemmän parametreja tekee mallista pienemmän ja tehokkaamman, mikä voi helpottaa sen käyttöä paikallisissa laitteissa, kuten älypuhelimissa ja kannettavissa tietokoneissa.

StableLM koulutettu uuteen The Pileen perustuvaan tietojoukkoon, sisältää 1,5 biljoonaa rahaketta, mikä on noin 3 kertaa The Pile -koko. Pile on laadukas ja monipuolinen tietojoukko kielimallien harjoittelua varten.

Stability AI mainitsee, että mallit ovat jo saatavilla GitHub-arkistossa ja että täydellinen valkoinen kirja on tulossa pian, ja odottaa innolla yhteistyön jatkamista kehittäjien ja tutkijoiden kanssa StableLM-sarjan julkaisemisen yhteydessä.

Lisäksi he mainitsevat RLHF:n avoimen yhteistyöohjelman käynnistämisen ja työskentelyn yhteisön toimien, kuten Open Assistantin, kanssa avoimen lähdekoodin tietojoukon luomiseksi tekoälyassistenteille.

Viimeinen mutta ei vähäisin, Kun puhutaan Stability AI -julkaisuista, voimme myös korostaa, että se ilmoitti beetajulkaisusta SDXL (joka tulee sanoista Stable Diffusion Extra Large), uusi tekoälymalli, joka pystyy luomaan kuvia tekstin kuvauksista. SDXL on uusin lisäys Stable Diffusion -sarjaan, joka sisältää myös SD-, SDT- ja SDC-malleja.

SDXL eroaa muista malleista kooltaan ja ominaisuuksiltaan. 2300 miljardilla parametrilla SDXL on yli 2,5 kertaa suurempi kuin alkuperäinen SD-malli, jolla oli vain 890 miljoonaa. Näiden lisäparametrien avulla SDXL voi luoda kuvia, jotka sopivat paremmin monimutkaisiin kuvioihin. SDXL voi esimerkiksi tuottaa kuviin luettavaa tekstiä tai luoda hämmästyttävän realistisia muotokuvia fiktiivisistä hahmoista.

SDXL on tällä hetkellä betavaiheessa DreamStudiossa ja muissa suosituissa kuvantamissovelluksissa, kuten NightCafe Creatorissa. Kuten kaikki Stability AI -mallit, SDXL julkaistaan ​​pian avoimena lähdekoodina optimaalisen käytettävyyden takaamiseksi. Stability AI ilmoittaa, että SDXL on lisensoitu kaupalliseen ja ei-kaupalliseen käyttöön, kunhan noudatat eettisiä ja laillisia ohjeita.

Lopuksi, jos haluat tietää enemmän siitä, voit tutustua yksityiskohtiin Seuraavassa linkissä.