SEED RL ، إطار عمل Google مفتوح المصدر لنماذج الذكاء الاصطناعي

الكثير صدر باحثو جوجل خبر تطويرها لإطار عمل جديد يمتد تدريب نماذج الذكاء الاصطناعي إلى آلاف الآلات. النتيجة تسمى البذور رل (التعلم التعزيزي العميق الفعال القابل للتطوير).

هذا هو تطور واعد لأنه يجب علي تمكن من تدريب خوارزميات الذكاء الاصطناعي على ملايين الصور في الثانية وخفض تكاليف هذا التدريب بنسبة 80٪ ، قالت Google في ورقة بحثية.

يمكن أن يساعد هذا النوع من التقليص في تكافؤ الفرص أمام الشركات الناشئة. حتى الآن لم تكن قادرة على منافسة الشركات الرئيسية مثل Google في مجال الذكاء الاصطناعي. تكلفة تدريب نماذج التعلم الآلي المتطورة في السحابة مرتفعة بشكل مدهش. تضفي Google الطابع الرسمي على افتتاح رمز SEED RL ، وهو مشروع يهدف إلى تحسين نسبة التكلفة / الأداء للتعلم المعزز.

التعلم المعزز هو نهج حالة استخدام محدد للغاية حيث يتعلم الوكلاء عن بيئتهم من خلال الاستكشاف وتحسين إجراءاتهم للحصول على أكبر قدر من المكافآت.

في »SEED RL: Deep-RL القابل للتطوير والفعالية مع الاستدلال المركزي المتسارع" ، قدمنا ​​وكيل RL الذي يتسع لآلاف الآلات ، مما يتيح التدريب بملايين الإطارات في الثانية ويحسن بشكل كبير الكفاءة الحسابية. يتم تحقيق ذلك من خلال بنية جديدة تستفيد من المسرعات (GPU أو TPU) على نطاق واسع من خلال استدلال النموذج المركزي وإدخال طبقة اتصال سريعة.

نعرض أداء SEED RL على معايير RL الشائعة مثل Google Research Football و Arcade Learning Environment و DeepMind Lab ، ونبين أنه باستخدام نماذج أكبر ، يمكن زيادة كفاءة البيانات. تم فتح الكود على Github مع أمثلة للتشغيل على Google Cloud باستخدام GPU.

يعتمد SEED RL على إطار عمل TensorFlow 2.0 y يعمل باستخدام مجموعة من وحدات معالجة الرسومات ووحدات معالجة الموتر لمركزية استدلال النموذج. يتم الاستدلال مركزيًا باستخدام مكون التعلم الذي يقوم بتدريب النموذج.

يتم تخزين المتغيرات ومعلومات الحالة الخاصة بالنموذج المستهدف محليًا ويتم إرسال الملاحظات عليها إلى الطالب في كل مرحلة من مراحل العملية. يستخدم SEED RL أيضًا مكتبة شبكة تستند إلى إطار عمل RPC العالمي مفتوح المصدر لتقليل زمن الوصول.

الكثير قال باحثو جوجل أن مكون التعلم بواسطة SEED RL يمكن توسيعها إلى آلاف النوى ، في حين أن عدد الممثلين المراد تكراره بين إجراء القياسات في البيئة وتشغيل استنتاج على النموذج للتنبؤ بالإجراء التالي ، يمكن زيادته إلى آلاف الآلات.

قيمت Google فعالية SEED RL من خلال مقارنتها ببيئة تعلم Arcade الشهيرة وبيئة Google Research Football والعديد من بيئات DeepMind Lab. تظهر النتائج أنهم تمكنوا من حل مهمة Google Research Football أثناء تدريب النموذج بسرعة 2,4 مليون إطار في الثانية باستخدام 64 شريحة من وحدة معالجة الموتر السحابي.

قالت جوجل إنها أسرع بنحو 80 مرة من الإطارات السابقة.

"هذا يترجم إلى تسريع زمني كبير ، نظرًا لأن المسرعات أرخص بكثير لكل عملية من وحدات المعالجة المركزية (CPU) ، فإن تكلفة التجارب تنخفض بشكل كبير." نعتقد أن SEED RL والنتائج المقدمة تُظهر أن التعلم المعزز قد استوعب مرة أخرى بقية التعلم العميق فيما يتعلق باستخدام المسرع "، كما كتب Lasse Espeholt ، مهندس الأبحاث في Google Research.

مع بنية محسّنة للاستخدام في المسرّعات الحديثة ، من الطبيعي زيادة حجم النموذج في محاولة لزيادة كفاءة البيانات.

قالت Google إن شفرة SEED RL مفتوحة المصدر ومتاحة على Github ، بالإضافة إلى أمثلة توضح كيفية تشغيله على Google Cloud مع وحدات معالجة الرسومات.

أخيرًا ، بالنسبة لأولئك المهتمين بهذا الإطار الجديد ، يمكنهم الانتقال إلى الرابط التالي حيث يمكنهم العثور على مزيد من المعلومات حوله. الرابط هو هذا. 

مصدر: https://ai.googleblog.com/


اترك تعليقك

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها ب *

*

*

  1. المسؤول عن البيانات: ميغيل أنخيل جاتون
  2. الغرض من البيانات: التحكم في الرسائل الاقتحامية ، وإدارة التعليقات.
  3. الشرعية: موافقتك
  4. توصيل البيانات: لن يتم إرسال البيانات إلى أطراف ثالثة إلا بموجب التزام قانوني.
  5. تخزين البيانات: قاعدة البيانات التي تستضيفها شركة Occentus Networks (الاتحاد الأوروبي)
  6. الحقوق: يمكنك في أي وقت تقييد معلوماتك واستعادتها وحذفها.