StableLM, ChatGPT'ye açık kaynaklı bir alternatif

KararlıLM

StableLM ve verimli bir şekilde metin ve kod oluşturmak için tasarlanmıştır

Öyle bir haber çıktı ki kararlılık AI, Kararlı Difüzyon görüntüleme yapay zeka modelinin arkasındaki şirket, StableLM dil modelleri setinin ilkini duyurdu.

Bununla Kararlılık, açık kaynaklı görüntü sentezi modelinin etkilerini çoğaltmayı umuyor Kararlı Difüzyon, 2022'de piyasaya sürüldü. İyileştirmeyle StableLM, ChatGPT'ye açık kaynaklı bir alternatif oluşturmak için kullanılabilir.

Stability AI'ye aşina olmayanlar için bilmelisiniz ki bu, kendisini ChatGPT gibi güçlü ancak tescilli yapay dil modelleri geliştiren bir şirket olan OpenAI'ye açık kaynak rakibi olarak konumlandıran Londra merkezli bir şirkettir.

StableLM Hakkında

KararlıLM Stability AI tarafından oluşturulan yapay dil modelleri ailesinin adıdır, açık kaynak olarak mevcut olan Creative Commons BY-SA-4.0 lisansı altında GitHub'daStableLM bir metin oluşturma modelidir İnsan metnini oluşturabilen ve sıradaki bir sonraki kelimeyi tahmin ederek programlar yazabilen. "Çip tahmini" adı verilen bir teknik kullanır bir insan tarafından bir "ipucu" şeklinde sağlanan bağlamdan bir sonraki kelime parçasını tahmin etmeyi içerir.

Diğer "küçük" LLM'ler gibi StableLM, GPT-3 referans modeline benzer bir performans elde ettiğini iddia ediyor çok daha az genel parametre kullanırken (StableLM için 7 milyar, GPT-175 için 3 milyar).

StableLM'nin piyasaya sürülmesi, kar amacı gütmeyen bir araştırma merkezi olan EleutherAI ile önceki açık kaynak dil modelleriyle ilgili deneyimimize dayanmaktadır. Bu dil modelleri, açık kaynak veri kümesi The Pile üzerinde eğitilmiş GPT-J, GPT-NeoX ve Pythia paketini içerir.

KararlıLM GPT-3'e benzer performansa sahip olduğunu iddia ediyor, çok daha az parametre kullanırken (7 milyara karşı 175 milyar) ChatGPT'ye güç veren dil modeli. Parametreler, modelin eğitim verilerinden öğrenmek için kullandığı değişkenlerdir. Daha az parametreye sahip olmak, modeli daha küçük ve daha verimli hale getirerek akıllı telefonlar ve dizüstü bilgisayarlar gibi yerel cihazlarda çalışmayı kolaylaştırabilir.

KararlıLM The Pile tabanlı yeni bir veri kümesi üzerinde eğitilmiş, The Pile boyutunun yaklaşık 1,5 katı olan 3 trilyon jeton içerir. Pile, eğitim dili modelleri için yüksek kaliteli ve çeşitli bir veri kümesidir.

Stability AI, şablonların GitHub deposunda zaten mevcut olduğunu ve tam bir teknik incelemenin yakında çıkacağını belirtiyor ve StableLM paketini kullanıma sunarken geliştiriciler ve araştırmacılarla işbirliğine devam etmeyi dört gözle bekliyor.

Ayrıca, RLHF açık işbirliği programının başlatılmasından ve AI asistanları için açık kaynaklı bir veri kümesi oluşturmak üzere Open Assistant gibi topluluk çabalarıyla birlikte çalışılmasından bahsediyorlar.

Sonuncu ama bir o kadar önemli, Stability AI sürümlerinden bahsetmişken, duyurulduğunu da vurgulayabiliriz. beta sürümü SDXL (Stable Diffusion Extra Large anlamına gelir), metinsel açıklamalardan görüntüler üretebilen yeni bir yapay zeka modeli. SDXL, SD, SDT ve SDC modellerini de içeren Stable Diffusion paketinin en son üyesidir.

SDXL, boyutu ve yetenekleri bakımından diğer modellerden farklıdır. 2300 milyar parametreyle SDXL, yalnızca 2,5 milyona sahip olan orijinal SD modelinden 890 kat daha büyüktür. Bu ek parametreler, SDXL'in karmaşık modellere daha iyi uyan görüntüler oluşturmasına olanak tanır. Örneğin, SDXL görüntüler üzerinde okunabilir metinler üretebilir veya kurgusal karakterlerin çarpıcı derecede gerçekçi portrelerini oluşturabilir.

SDXL şu anda DreamStudio'da ve NightCafe Creator gibi diğer popüler görüntüleme uygulamalarında beta sürümündedir. Tüm Stability AI modellerinde olduğu gibi, SDXL de optimum erişilebilirlik için yakında açık kaynak olarak piyasaya sürülecek. Stability AI, etik ve yasal yönergelere uyduğunuz sürece SDXL'nin ticari ve ticari olmayan kullanım için izin verilen şekilde lisanslandığını duyurur.

Son olarak, bu konuda daha fazla bilgi edinmek istiyorsanız, ayrıntılara başvurabilirsiniz. Aşağıdaki bağlantıda.