StableLM un ir paredzēts efektīvai teksta un koda ģenerēšanai
Tika izlaista ziņa, ka Stabilitātes AI, uzņēmums, kas ir stabilas difūzijas attēlveidošanas AI modeļa pamatā, ir paziņojis par pirmo StableLM valodu modeļu komplektu.
Ar to Stabilitāte cer atkārtot sava atvērtā pirmkoda attēlu sintēzes modeļa efektus Stabila difūzija, izlaists 2022. gadā. Uzlabojot, StableLM varētu izmantot, lai izveidotu atvērtā pirmkoda alternatīvu ChatGPT.
Tiem, kas nav pazīstami ar Stabilitātes AI, jums jāzina, ka šis ir Londonā bāzēts uzņēmums, kas sevi pozicionē kā OpenAI konkurentu, kas ir uzņēmums, kas izstrādā spēcīgus, bet patentētus mākslīgās valodas modeļus, piemēram, ChatGPT.
Par StableLM
StableLM ir Stability AI radīto mākslīgo valodu modeļu saimes nosaukums, kas ir pieejami kā atvērtā koda vietnē GitHub saskaņā ar Creative Commons BY-SA-4.0 licenci. StableLM ir teksta ģenerēšanas modelis kas var sastādīt cilvēku tekstu un rakstīt programmas, paredzot nākamo vārdu pēc kārtas. Tas izmanto paņēmienu, ko sauc par "čipu prognozēšanu" kas ietver nākamā vārda fragmenta uzminēšanu no cilvēka sniegtā konteksta “mājiena” formā.
Tāpat kā citi "mazie" LLM StableLM apgalvo, ka sasniegs līdzīgu veiktspēju kā GPT-3 atsauces modelim OpenAI, vienlaikus izmantojot daudz mazāk vispārējo parametru (7 miljardi StableLM, salīdzinot ar 175 miljardiem GPT-3).
StableLM izlaišana balstās uz mūsu pieredzi ar iepriekšējiem atvērtā pirmkoda valodu modeļiem ar bezpeļņas pētniecības centru EleutherAI. Šajos valodu modeļos ietilpst GPT-J, GPT-NeoX un Pythia komplekts, kas tika apmācīti, izmantojot atvērtā pirmkoda datu kopu The Pile.
StableLM apgalvo, ka tam ir līdzīga veiktspēja kā GPT-3, valodas modelis, kas nodrošina ChatGPT darbību, vienlaikus izmantojot daudz mazāk parametru (7 miljardi pret 175 miljardiem). Parametri ir mainīgie, ko modelis izmanto, lai mācītos no apmācības datiem. Ja ir mazāk parametru, modelis kļūst mazāks un efektīvāks, kas var atvieglot tā darbību vietējās ierīcēs, piemēram, viedtālruņos un klēpjdatoros.
StableLM apmācīti, izmantojot jaunu datu kopu, kuras pamatā ir The Pile, kas satur 1,5 triljonus žetonu, kas ir aptuveni 3 reizes lielāks par The Pile. Pile ir augstas kvalitātes un daudzveidīga datu kopa valodu modeļu apmācībai.
Stabilitātes AI piemin, ka veidnes jau ir pieejamas GitHub krātuvē un drīzumā tiks publicēts pilns dokuments, un cer, ka varēs turpināt sadarbību ar izstrādātājiem un pētniekiem, izlaižot StableLM komplektu.
Turklāt viņi min RLHF atvērtās sadarbības programmas uzsākšanu un darbu ar kopienas pasākumiem, piemēram, Open Assistant, lai izveidotu atvērtā pirmkoda datu kopu AI palīgiem.
Pēdējais bet ne sliktākais, Runājot par Stabilitātes AI izlaidumiem, mēs varam arī uzsvērt, ka tā paziņoja gada beta versija SDXL (kas apzīmē Stable Diffusion Extra Large), jauns mākslīgā intelekta modelis, kas spēj ģenerēt attēlus no teksta aprakstiem. SDXL ir jaunākais Stable Diffusion komplekta papildinājums, kas ietver arī SD, SDT un SDC modeļus.
SDXL atšķiras no citiem modeļiem ar saviem izmēriem un iespējām. Ar 2300 miljardiem parametru SDXL ir vairāk nekā 2,5 reizes lielāks nekā sākotnējais SD modelis, kuram bija tikai 890 miljoni. Šie papildu parametri ļauj SDXL ģenerēt attēlus, kas labāk atbilst sarežģītiem modeļiem. Piemēram, SDXL var izveidot lasāmu tekstu uz attēliem vai radīt pārsteidzoši reālistiskus izdomātu varoņu portretus.
SDXL pašlaik ir beta versijā DreamStudio un citās populārās attēlveidošanas lietojumprogrammās, piemēram, NightCafe Creator. Tāpat kā visi Stabilitātes AI modeļi, arī SDXL drīzumā tiks izlaists kā atvērtais avots optimālai pieejamībai. Stabilitātes AI paziņo, ka SDXL ir atļauta licence komerciālai un nekomerciālai lietošanai, ja vien ievērojat ētikas un juridiskās vadlīnijas.
Visbeidzot, ja jūs interesē uzzināt vairāk par to, varat iepazīties ar informāciju Šajā saitē.