នេះ អ្នកស្រាវជ្រាវហ្គូហ្គោលបានចេញផ្សាយ ព័ត៌មានអំពីការអភិវឌ្ឍក្របខ័ណ្ឌថ្មីដែលពង្រីកការបណ្តុះបណ្តាលគំរូបញ្ញាសិប្បនិម្មិតដល់ម៉ាស៊ីនរាប់ពាន់គ្រឿង។ លទ្ធផលត្រូវបានគេហៅថា ស៊ីឌីអិល (ការពង្រឹងការរៀនជ្រៅជ្រះប្រកបដោយប្រសិទ្ធភាព) ។
នេះគឺជា ការអភិវឌ្ឍប្រកបដោយជោគជ័យ ព្រោះខ្ញុំគួរតែ អនុញ្ញាតឱ្យក្បួនដោះស្រាយបញ្ញាសិប្បនិម្មិតត្រូវបានបណ្តុះបណ្តាលនៅរូបភាពរាប់លានក្នុងមួយវិនាទី និងកាត់បន្ថយចំណាយនៃការបណ្តុះបណ្តាលនេះឱ្យបាន ៨០% ។
ប្រភេទនៃការធ្លាក់ចុះនេះអាចជួយកម្រិតនៃការលេងសម្រាប់ការចាប់ផ្តើមអាជីវកម្ម។ ដែលរហូតមកដល់ពេលនេះមិនអាចប្រកួតប្រជែងជាមួយក្រុមហ៊ុនធំ ៗ ដូចជាហ្គូហ្គោលក្នុងវិស័យអាយអេស។ តម្លៃនៃការបណ្តុះបណ្តាលម៉ូដែលរៀនម៉ាស៊ីនទំនើបនៅក្នុងពពកគឺខ្ពស់គួរឱ្យភ្ញាក់ផ្អើល។ ហ្គូហ្គលជាផ្លូវការនៃការបើកកូដ SEED RL ដែលជាគម្រោងមានគោលបំណងបង្កើនប្រសិទ្ធភាពចំណាយ / សមាមាត្រនៃការរៀនពង្រឹង។
ការរៀនសូត្រពង្រឹងគឺវិធីសាស្រ្តប្រើជាក់លាក់ជាក់លាក់ដែលភ្នាក់ងារសិក្សាអំពីបរិស្ថានរបស់ពួកគេតាមរយៈការរុករកនិងបង្កើនប្រសិទ្ធភាពសកម្មភាពរបស់ពួកគេដើម្បីទទួលបានរង្វាន់ច្រើនបំផុត។
នៅក្នុង» SEED RL: អាចធ្វើមាត្រដ្ឋានបាននិងមានប្រសិទ្ធិភាពស៊ីជម្រៅជាមួយនឹងអេជេស៊្រីកណ្តាលដែលត្រូវបានពន្លឿន "យើងបានណែនាំភ្នាក់ងារ RL ដែលជញ្ជីងទៅម៉ាស៊ីនរាប់ពាន់ដែលបើកការបណ្តុះបណ្តាលនៅហ្វ្រេមរាប់លានក្នុងមួយវិនាទីនិងធ្វើអោយប្រសើរឡើងនូវប្រសិទ្ធភាពនៃការគណនា។ នេះត្រូវបានសម្រេចដោយស្ថាបត្យកម្មប្រលោមលោកដែលទាញយកអត្ថប្រយោជន៍ពីឧបករណ៍បង្កើនល្បឿន (GPU ឬ TPU) តាមទំហំដោយយកគំរូតាមបែបមជ្ឈការនិងណែនាំស្រទាប់ទំនាក់ទំនងលឿន។
យើងបង្ហាញពីការសម្តែងរបស់ SEED RL លើលក្ខណៈវិនិច្ឆ័យ RL ដែលមានប្រជាប្រិយដូចជាហ្គូហ្គោលហ្គែលហ្គែលហ្គែលហ្គែលហ្គេនឌ្រីហ្គែនអេសអេនអេសអេលអេសអេលនិងបង្ហាញថាដោយប្រើម៉ូដែលធំប្រសិទ្ធភាពទិន្នន័យអាចត្រូវបានបង្កើន លេខកូដត្រូវបានបើកនៅលើ Github រួមជាមួយឧទាហរណ៍ដើម្បីដំណើរការលើ Google Cloud ជាមួយ GPU ។
SEED RL គឺផ្អែកលើក្របខ័ណ្ឌ TensorFlow 2.0 y ធ្វើការដោយប្រើបន្សំនៃផ្នែកដំណើរការក្រាហ្វិក និងអង្គភាពកែច្នៃតង់ស្យុងដើម្បីធ្វើឱ្យចំណូលចិត្តម៉ូដែលកណ្តាល ការរួមបញ្ចូលត្រូវបានធ្វើឡើងដោយប្រើផ្នែកសិក្សាដែលបណ្តុះបណ្តាលគំរូ។
អថេរនិងព័ត៌មានរដ្ឋនៃគំរូគោលដៅត្រូវបានរក្សាទុកក្នុងស្រុក ហើយការសង្កេតលើពួកគេត្រូវបានបញ្ជូនទៅសិស្សនៅដំណាក់កាលនីមួយៗនៃដំណើរការ។ SEED RL ក៏ប្រើបណ្ណាល័យបណ្តាញដែលមានមូលដ្ឋានលើក្របខ័ណ្ឌ RPC ជាសកលប្រភពបើកចំហដើម្បីកាត់បន្ថយភាពយឺតយ៉ាវ។
នេះ អ្នកស្រាវជ្រាវហ្គូហ្គោលបាននិយាយថាសមាសធាតុនៃការរៀនសូត្រ ដោយ SEED RL អាចត្រូវបានពង្រីកដល់រាប់ពាន់ស្នូល ខណៈពេលដែលចំនួនតួសម្តែងត្រូវធ្វើម្តងទៀតរវាងការវាស់ស្ទង់បរិស្ថាននិងអនុវត្តការមិនពេញចិត្តលើគំរូដើម្បីទស្សទាយសកម្មភាពបន្ទាប់អាចត្រូវបានបង្កើនដល់រាប់ពាន់គ្រឿង។
ហ្គូហ្គលបានវាយតម្លៃពីប្រសិទ្ធភាពនៃ SEED RL ដោយប្រៀបធៀបវាទៅនឹងបរិស្ថានសិក្សាអាហ្គេតដែលមានប្រជាប្រិយបរិស្ថានហ្គូហ្គោលបាល់ទាត់ស្រាវជ្រាវនិងបរិស្ថានបរិស្ថានឌីអិមអេលផ្សេងៗគ្នា។ លទ្ធផលបង្ហាញថាពួកគេអាចដោះស្រាយភារកិច្ចរបស់ហ្គូហ្គោលបាល់ទាត់ក្នុងពេលកំពុងបណ្តុះបណ្តាលគំរូក្នុងល្បឿន ២,៤ លានហ្វ្រេមក្នុងមួយវិនាទី ដោយប្រើបន្ទះឈីបចំនួន ៦៤ បន្ទះឈីប។
Google និយាយថាវាលឿនជាងស៊ុមមុនប្រហែល ៨០ ដង។
"នេះប្រែទៅជាការបង្កើនពេលវេលាដ៏សំខាន់មួយពីព្រោះឧបករណ៍បង្កើនល្បឿនមានតម្លៃថោកជាងប្រតិបត្តិការច្រើនជាងស៊ីភីយូថ្លៃនៃការពិសោធន៍ត្រូវបានកាត់បន្ថយយ៉ាងខ្លាំង" ។ យើងជឿជាក់ថា SEED RL និងលទ្ធផលដែលបានបង្ហាញបង្ហាញថាការរៀនសូត្រពង្រឹងបានទទួលនូវការរៀនស៊ីជម្រៅជាថ្មីម្តងទៀតទាក់ទងនឹងការប្រើប្រាស់ល្បឿន។
ជាមួយនឹងស្ថាបត្យកម្មមួយដែលត្រូវបានធ្វើឱ្យប្រសើរឡើងសម្រាប់ប្រើនៅក្នុងឧបករណ៍បង្កើនល្បឿនទំនើបវាជាធម្មជាតិដើម្បីបង្កើនទំហំនៃគំរូក្នុងការប៉ុនប៉ងដើម្បីបង្កើនប្រសិទ្ធភាពទិន្នន័យ។
ក្រុមហ៊ុន Google បាននិយាយថាកូដ SEED RL គឺជាប្រភពកូដបើកចំហនិងមាននៅលើគេហទំព័រ Github ។ ក៏ដូចជាឧទាហរណ៍ដែលបង្ហាញពីរបៀបធ្វើឱ្យវាដំណើរការលើហ្គូហ្គលពពកជាមួយផ្នែកដំណើរការក្រាហ្វិក។
ចុងបញ្ចប់សម្រាប់អ្នកដែលចាប់អារម្មណ៍នឹងក្របខ័ណ្ឌថ្មីនេះពួកគេអាចចូលទៅកាន់តំណភ្ជាប់ខាងក្រោមដែលពួកគេអាចស្វែងរកព័ត៌មានបន្ថែមអំពីវា។ តំណគឺនេះ។
ប្រភព: https://ai.googleblog.com/
ធ្វើជាយោបល់ដំបូង