कृत्रिम बुद्धिमत्ता मॉडेल्ससाठी Google ओपन सोर्स फ्रेमवर्क सीड आरएल

अगोदर निर्देश केलेल्या बाबीसंबंधी बोलताना गुगल संशोधकांनी सोडले कृत्रिम बुद्धिमत्ता मॉडेल्सचे प्रशिक्षण हजारो मशीनपर्यंत वाढविणार्‍या एका नवीन फ्रेमवर्कच्या विकासाबद्दलची बातमी. निकाल म्हणतात बीज आरएल (स्केलेबल कार्यक्षम खोल मजबुतीकरण शिक्षण).

हे आहे आश्वासक विकास कारण मी पाहिजे कृत्रिम बुद्धिमत्ता अल्गोरिदम प्रति सेकंद लाखो प्रतिमांना प्रशिक्षण द्या आणि या प्रशिक्षण खर्चात 80% कमी करा, असे एका संशोधन पत्रकात गुगलने म्हटले आहे.

या प्रकारचे आकार कमी केल्याने स्टार्टअप्ससाठी प्लेिंग फील्ड समतल होण्यास मदत होते. आतापर्यंत एआयच्या क्षेत्रात गूगलसारख्या मुख्य लोकांशी स्पर्धा करू शकलो नाही. क्लाऊडमध्ये अत्याधुनिक मशीन लर्निंग मॉडेल्सच्या प्रशिक्षणाची किंमत आश्चर्यकारकपणे जास्त आहे. सीईड आरएल कोड उघडण्याच्या औपचारिकतेसाठी गूगलने, मजबुतीकरण शिक्षणाच्या किंमती / कामगिरीचे प्रमाण अनुकूलित करण्याचा प्रकल्प आहे.

मजबुतीकरण शिक्षण हा एक विशिष्ट वापर-प्रकरण आहे ज्यामध्ये एजंट्स अन्वेषणाद्वारे त्यांच्या वातावरणाबद्दल जाणून घेतात आणि सर्वात जास्त बक्षिसे मिळविण्यासाठी त्यांच्या कृती अनुकूलित करतात.

R बियाणे आरएल मध्ये: स्केलेबल आणि कार्यक्षम दीप-आरएल सह प्रवेगक मध्यवर्ती अनुमान ", आम्ही एक आरएल एजंट सादर केला जो हजारो मशीनला आकर्षित करतो, लाखो फ्रेम प्रति सेकंदात प्रशिक्षण सक्षम करतो आणि संगणकीय कार्यक्षमतेत लक्षणीय सुधारणा करतो. हे एका कादंबरी आर्किटेक्चरद्वारे साध्य केले गेले आहे जे मॉडेल अनुमान केंद्रीकृत करून आणि वेगवान संप्रेषण थर सादर करून स्केलवर प्रवेगक (जीपीयू किंवा टीपीयू) चा फायदा घेते.

आम्ही गूगल रिसर्च फुटबॉल, आर्केड लर्निंग एनवायरनमेंट, आणि डीप माइंड लॅब सारख्या लोकप्रिय आरएल बेंचमार्कवर सीईड आरएल कामगिरी प्रदर्शित करतो आणि हे दर्शवितो की मोठ्या मॉडेल्सचा उपयोग करून डेटा कार्यक्षमता वाढवता येते. जीपीयूसह गुगल क्लाऊडवर चालवण्याच्या उदाहरणांसह गीथूबवर कोड उघडला गेला आहे.

सीड आरएल टेन्सरफ्लो २.० फ्रेमवर्कवर आधारित आहे y ग्राफिक्स प्रोसेसिंग युनिट्सचे संयोजन वापरून कार्य करते आणि मॉडेल अनुमान केंद्रीकृत करण्यासाठी टेन्सर प्रोसेसिंग युनिट्स. मॉडेलला प्रशिक्षण देणार्‍या शिक्षण घटकांचा वापर करून अनुमान लावला जातो.

लक्ष्य मॉडेलची चल आणि राज्य माहिती स्थानिक पातळीवर संग्रहित केली जाते आणि त्यावरील निरीक्षणे प्रक्रियेच्या प्रत्येक टप्प्यावर विद्यार्थ्यास पाठविली जातात. उशीरा कमी करण्यासाठी ओपन सोर्स युनिव्हर्सल आरपीसी फ्रेमवर्कवर आधारित सीईड आरएल नेटवर्क लायब्ररी देखील वापरते.

अगोदर निर्देश केलेल्या बाबीसंबंधी बोलताना गुगल संशोधकांनी असे म्हटले आहे की शिकण्याचे घटक सीड आरएल द्वारे हजारो कोअरपर्यंत वाढवता येऊ शकते, वातावरणातील मोजमाप घेणे आणि पुढील कृतीचा अंदाज लावण्यासाठी मॉडेलवर अनुमान लावणे या दरम्यान कलाकारांची संख्या पुनरावृत्ती करणे हजारो मशीनपर्यंत मोजले जाऊ शकते.

लोकप्रिय आरकेड लर्निंग पर्यावरण, गूगल रिसर्च फुटबॉल वातावरण आणि विविध डीप माइंड लॅब वातावरणाशी तुलना करून सीईड आरएलच्या प्रभावीतेचे मूल्यांकन गूगलने केले. परिणाम असे दर्शवितो की त्यांनी मॉडेलला २.2,4 दशलक्ष प्रशिक्षण देताना गूगल रिसर्च फुटबॉल कार्य सोडवले. क्लाउड टेन्सर प्रोसेसिंग युनिटच्या 64 चिप्स वापरुन फ्रेम प्रति सेकंद.

मागील फ्रेमपेक्षा हे 80 पट अधिक वेगवान आहे, असे गुगलने म्हटले आहे.

"हे एका महत्त्वपूर्ण वेळेच्या प्रवेगात भाषांतरित करते, कारण सीपीयूपेक्षा प्रवेगक कामकाजापेक्षा कमी किमतीची कामे केली जातात, त्यामुळे प्रयोगांची किंमत खूपच कमी केली जाते." गूगल रिसर्चचे संशोधन अभियंता लासे एस्पीहोल्ट लिहितात, "आम्हाला वाटते की सीईड आरएल आणि सादर केलेल्या निकालांनी हे सिद्ध केले आहे की प्रवर्ती वापराच्या बाबतीत पुन्हा सशक्तीकरण शिक्षण उर्वरित सखोल अभ्यासात सापडले आहे."

आधुनिक प्रवेगकांच्या वापरासाठी अनुकूलित आर्किटेक्चरमुळे डेटाची कार्यक्षमता वाढविण्याच्या प्रयत्नात मॉडेलचा आकार वाढविणे स्वाभाविक आहे.

गुगलने सांगितले की एसईड आरएल कोड मुक्त स्रोत आहे आणि गीथबवर उपलब्ध आहे, तसेच ग्राफिक्स प्रोसेसिंग युनिटसह ते Google मेघ वर कसे कार्य करावे हे दर्शविणारी उदाहरणे.

अखेरीस, ज्यांना या नवीन चौकटीत स्वारस्य आहे त्यांच्यासाठी ते पुढील दुव्यावर जाऊ शकतात जिथे त्यांना त्याबद्दल अधिक माहिती मिळेल. दुवा हा आहे. 

स्त्रोत: https://ai.googleblog.com/


लेखाची सामग्री आमच्या तत्त्वांचे पालन करते संपादकीय नीति. त्रुटी नोंदविण्यासाठी क्लिक करा येथे.

टिप्पणी करणारे सर्वप्रथम व्हा

आपली टिप्पणी द्या

आपला ई-मेल पत्ता प्रकाशित केला जाणार नाही. आवश्यक फील्ड चिन्हांकित केले आहेत *

*

*

  1. डेटा जबाबदार: मिगुएल Áन्गल गॅटन
  2. डेटाचा उद्देशः नियंत्रण स्पॅम, टिप्पणी व्यवस्थापन.
  3. कायदे: आपली संमती
  4. डेटा संप्रेषण: कायदेशीर बंधन वगळता डेटा तृतीय पक्षास कळविला जाणार नाही.
  5. डेटा संग्रहण: ओकेन्टस नेटवर्क (EU) द्वारा होस्ट केलेला डेटाबेस
  6. अधिकारः कोणत्याही वेळी आपण आपली माहिती मर्यादित, पुनर्प्राप्त आणि हटवू शकता.