StableLM dhe është krijuar për të gjeneruar me efikasitet tekst dhe kod
Lajmi u bë i ditur se Stabiliteti AI, kompania që qëndron pas modelit të inteligjencës artificiale të imazhit të Difuzionit të Qëndrueshëm, ka njoftuar të parën e grupit të saj të modeleve të gjuhës StableLM.
Me atë Stabiliteti shpreson të përsërisë efektet e modelit të saj të sintezës së imazhit me burim të hapur Difuzion i qëndrueshëm, lëshuar në vitin 2022. Me përsosje, StableLM mund të përdoret për të ndërtuar një alternativë me burim të hapur ndaj ChatGPT.
Për ata që nuk janë të njohur me Stability AI, duhet të dini se kjo është një kompani me bazë në Londër që pozicionohet si një rival me burim të hapur ndaj OpenAI, një kompani që zhvillon modele të fuqishme, por të pronarit të gjuhës artificiale, si ChatGPT.
Rreth StableLM
I qëndrueshëmLM është emri i familjes së modeleve të gjuhës artificiale të krijuara nga Stability AI, të cilat janë në dispozicion si burim i hapur në GitHub nën licencën Creative Commons BY-SA-4.0. StableLM është një model i gjenerimit të tekstit që mund të kompozojë tekst njerëzor dhe të shkruajë programe duke parashikuar fjalën tjetër në një sekuencë. Ai përdor një teknikë të quajtur "parashikimi i çipave" e cila përfshin hamendjen e fragmentit të fjalës tjetër nga konteksti i ofruar nga një njeri në formën e një "aluzion".
Ashtu si LLM-të e tjera "të vogla". StableLM pretendon të arrijë performancë të ngjashme me modelin referencë GPT-3 i OpenAI duke përdorur shumë më pak parametra të përgjithshëm (7 miliardë për StableLM kundrejt 175 miliardë për GPT-3).
Publikimi i StableLM bazohet në përvojën tonë me modelet e mëparshme të gjuhëve me burim të hapur me EleutherAI, një qendër kërkimore jofitimprurëse. Këto modele gjuhësore përfshijnë GPT-J, GPT-NeoX dhe paketën Pythia, të cilat janë trajnuar në bazën e të dhënave me burim të hapur The Pile.
I qëndrueshëmLM pretendon se ka performancë të ngjashme me GPT-3, modeli i gjuhës që fuqizon ChatGPT, ndërkohë që përdor shumë më pak parametra (7 miliardë kundrejt 175 miliardë). Parametrat janë variabla që modeli përdor për të mësuar nga të dhënat e trajnimit. Të kesh më pak parametra e bën modelin më të vogël dhe më efikas, gjë që mund ta bëjë më të lehtë funksionimin në pajisjet lokale si telefonat inteligjentë dhe laptopët.
I qëndrueshëmLM të trajnuar në një bazë të dhënash të re të bazuar në The Pile, që përmban 1,5 trilion argumente, që është rreth 3 herë më e madhe se The Pile. Pile është një grup të dhënash me cilësi të lartë dhe të larmishme për trajnimin e modeleve gjuhësore.
Stabiliteti AI përmend se shabllonet janë tashmë të disponueshëm në depon e GitHub dhe se një letër e plotë e bardhë do të vijë së shpejti, dhe mezi pret të vazhdojë të bashkëpunojë me zhvilluesit dhe studiuesit ndërsa nxjerr paketën StableLM.
Përveç kësaj, ata përmendin nisjen e programit të bashkëpunimit të hapur RLHF dhe punën me përpjekjet e komunitetit si Open Assistant për të krijuar një bazë të dhënash me burim të hapur për asistentët e AI.
E fundit por jo më pak e, Duke folur për lëshimet e Stabilitetit AI, mund të theksojmë gjithashtu se ajo njoftoi lëshimi beta i SDXL (që qëndron për Stable Diffusion Extra Large), një model i ri i inteligjencës artificiale i aftë për të gjeneruar imazhe nga përshkrimet tekstuale. SDXL është shtesa më e fundit në paketën Stable Diffusion, e cila përfshin gjithashtu modelet SD, SDT dhe SDC.
SDXL ndryshon nga modelet e tjera në madhësinë dhe aftësitë e tij. Me 2300 miliardë parametra, SDXL është më shumë se 2,5 herë më i madh se modeli origjinal SD, i cili kishte vetëm 890 milionë. Këta parametra shtesë lejojnë SDXL të gjenerojë imazhe që i përmbahen më mirë modeleve komplekse. Për shembull, SDXL mund të prodhojë tekst të lexueshëm në imazhe ose të krijojë portrete jashtëzakonisht realiste të personazheve imagjinar.
SDXL është aktualisht në beta në DreamStudio dhe aplikacione të tjera të njohura të imazhit si NightCafe Creator. Ashtu si të gjitha modelet Stability AI, SDXL së shpejti do të dalë si burim i hapur për akses optimal. Stability AI njofton se SDXL është i licencuar në mënyrë të lejuar për përdorim komercial dhe jokomercial, për sa kohë që ndiqni udhëzimet etike dhe ligjore.
Së fundi, nëse jeni të interesuar të dini më shumë për të, mund të konsultoheni me detajet Në lidhjen vijuese.