StableLM، یک جایگزین متن باز برای ChatGPT

StableLM

StableLM و برای تولید موثر متن و کد طراحی شده است

این خبر منتشر شد که هوش مصنوعی پایداری، شرکت سازنده مدل هوش مصنوعی تصویربرداری Stable Diffusion، اولین سری از مدل های زبان StableLM خود را اعلام کرده است.

با آن Stability امیدوار است اثرات مدل سنتز تصویر منبع باز خود را تکرار کند انتشار پایدار، در سال 2022 منتشر شد. با اصلاحات، از StableLM می توان برای ساخت یک جایگزین متن باز برای ChatGPT استفاده کرد.

برای کسانی که با هوش مصنوعی پایداری آشنایی ندارند، باید بدانید که این یک شرکت مستقر در لندن است که خود را به عنوان رقیب منبع باز OpenAI، شرکتی که مدل های زبان مصنوعی قدرتمند اما اختصاصی مانند ChatGPT را توسعه می دهد، قرار می دهد.

درباره StableLM

StableLM نام خانواده مدل های زبان مصنوعی است که توسط Stability AI ایجاد شده است، که به صورت متن باز در دسترس هستند در GitHub تحت مجوز Creative Commons BY-SA-4.0StableLM یک مدل تولید متن است که می تواند متن انسانی بسازد و با پیش بینی کلمه بعدی در یک دنباله برنامه بنویسد. از تکنیکی به نام «پیش‌بینی تراشه» استفاده می‌کند. که شامل حدس زدن قطعه کلمه بعدی از بافت ارائه شده توسط یک انسان به شکل "اشاره" است.

مانند سایر LLM های "کوچک". StableLM ادعا می کند که عملکردی مشابه مدل مرجع GPT-3 دارد OpenAI در حالی که از پارامترهای عمومی بسیار کمتری استفاده می کند (7 میلیارد برای StableLM در مقابل 175 میلیارد برای GPT-3).

انتشار StableLM مبتنی بر تجربه ما با مدل‌های زبان منبع باز قبلی با EleutherAI، یک مرکز تحقیقاتی غیرانتفاعی است. این مدل‌های زبان شامل GPT-J، GPT-NeoX و مجموعه Pythia هستند که بر روی مجموعه داده منبع باز The Pile آموزش داده شده‌اند.

StableLM ادعا می کند که عملکردی مشابه با GPT-3 دارد، مدل زبانی که ChatGPT را تقویت می کند، در حالی که از پارامترهای بسیار کمتری استفاده می کند (7 میلیارد در مقابل 175 میلیارد). پارامترها متغیرهایی هستند که مدل برای یادگیری از داده های آموزشی استفاده می کند. داشتن پارامترهای کمتر، مدل را کوچکتر و کارآمدتر می کند، که می تواند اجرای آن را در دستگاه های محلی مانند تلفن های هوشمند و لپ تاپ ها آسان تر کند.

StableLM آموزش داده شده بر روی یک مجموعه داده جدید بر اساس The Pile، حاوی 1,5 تریلیون توکن است که تقریباً 3 برابر اندازه The Pile است. The Pile یک مجموعه داده با کیفیت بالا و متنوع برای آموزش مدل های زبان است.

هوش مصنوعی پایداری اشاره می‌کند که قالب‌ها در حال حاضر در مخزن GitHub در دسترس هستند و به زودی یک مقاله سفید کامل ارائه می‌شود، و مشتاقانه منتظر ادامه همکاری با توسعه‌دهندگان و محققان در هنگام عرضه مجموعه StableLM است.

علاوه بر این، آنها به راه اندازی برنامه همکاری باز RLHF و همکاری با تلاش های جامعه مانند Open Assistant برای ایجاد یک مجموعه داده منبع باز برای دستیاران هوش مصنوعی اشاره می کنند.

آخرین موضوع ولی به همان اهمیت، در مورد انتشارات هوش مصنوعی پایداری، می‌توانیم به این نکته نیز اشاره کنیم که اعلام کرده است انتشار بتا از SDXL (که مخفف Stable Diffusion Extra Large است)، یک مدل هوش مصنوعی جدید که قادر به تولید تصاویر از توضیحات متنی است. SDXL جدیدترین اضافه شده به مجموعه Stable Diffusion است که شامل مدل های SD، SDT و SDC نیز می شود.

SDXL از نظر اندازه و قابلیت ها با سایر مدل ها متفاوت است. با 2300 میلیارد پارامتر، SDXL بیش از 2,5 برابر بزرگتر از مدل اصلی SD است که تنها 890 میلیون پارامتر داشت. این پارامترهای اضافی به SDXL اجازه می دهد تا تصاویری تولید کند که بهتر به الگوهای پیچیده بپیوندند. برای مثال، SDXL می‌تواند متن قابل خواندن روی تصاویر تولید کند یا پرتره‌های واقعی واقعی از شخصیت‌های داستانی خلق کند.

SDXL در حال حاضر در DreamStudio و سایر برنامه های تصویربرداری محبوب مانند NightCafe Creator در نسخه بتا قرار دارد. مانند تمام مدل‌های Stability AI، SDXL به زودی به عنوان منبع باز برای دسترسی بهینه منتشر خواهد شد. هوش مصنوعی پایداری اعلام می‌کند که SDXL مجاز به استفاده تجاری و غیرتجاری است، تا زمانی که از دستورالعمل‌های اخلاقی و قانونی پیروی کنید.

در نهایت ، اگر علاقمند به دانستن اطلاعات بیشتر در مورد آن هستید ، می توانید از جزئیات مشورت کنید در لینک زیر.


محتوای مقاله به اصول ما پیوست اخلاق تحریریه. برای گزارش یک خطا کلیک کنید اینجا.

اولین کسی باشید که نظر

نظر خود را بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخشهای موردنیاز علامتگذاری شدهاند با *

*

*

  1. مسئول داده ها: میگل آنخل گاتون
  2. هدف از داده ها: کنترل هرزنامه ، مدیریت نظرات.
  3. مشروعیت: رضایت شما
  4. ارتباط داده ها: داده ها به اشخاص ثالث منتقل نمی شوند مگر با تعهد قانونی.
  5. ذخیره سازی داده ها: پایگاه داده به میزبانی شبکه های Occentus (EU)
  6. حقوق: در هر زمان می توانید اطلاعات خود را محدود ، بازیابی و حذف کنید.