SEED RL, жасанды интеллект модельдеріне арналған Google ашық көзі

The Google зерттеушілері шығарды жасанды интеллект модельдерін мыңдаған машиналарға дейін кеңейтуге мүмкіндік беретін жаңа құрылымның дамуы туралы жаңалықтар. Нәтиже деп аталады Тұқымдық RL (ауқымды тиімді тереңдете оқыту).

Бұл болашағы зор даму өйткені мен керек жасанды интеллект алгоритмдерін секундына миллион кескінге үйретуге мүмкіндік беру және осы дайындыққа кететін шығындарды 80% төмендету керек, - дейді Google зерттеу мақаласында.

Мұндай қысқарту стартаптар үшін жағдайды теңестіруге көмектесе алады. осы уақытқа дейін жасанды интеллект саласында Google сияқты негізгілермен бәсекелесе алмадық. Бұлтта күрделі машиналық оқыту модельдерін оқыту құны таңқаларлықтай жоғары. Google SEED RL кодының ашылуын ресімдейді, бұл арматуралық оқытудың шығын / өнімділік коэффициентін оңтайландыруға бағытталған жоба.

Арматуралық оқыту дегеніміз - бұл агенттер барлау арқылы қоршаған ортасы туралы білетін және өз іс-әрекеттерін оңтайландыратын ең нақты әдіс.

»SEED RL: Орталықтандырылған қортындысы бар масштабталатын және тиімді Deep-RL» біз секундына миллион кадрлармен жаттығулар жасауға мүмкіндік беретін және есептеу тиімділігін едәуір арттыратын мыңдаған машиналарға масштабтайтын RL агентті ұсындық. Бұған модельдер қорытындысын орталықтандыру және жылдам байланыс қабатын енгізу арқылы масштабта үдеткіштердің (GPU немесе TPU) артықшылығын пайдаланатын жаңа архитектураның көмегімен қол жеткізіледі.

Біз Google Research Football, Arcade Learning Environment және DeepMind Lab сияқты танымал RL критерийлерінде SEED RL өнімділігін көрсетеміз және үлкен модельдерді қолдану арқылы деректер тиімділігін арттыруға болатындығын көрсетеміз. Github-та код Google Cloud-та GPU-мен жұмыс істеуге арналған мысалдармен бірге ашылды.

SEED RL TensorFlow 2.0 негізіне негізделген y графикалық өңдеу қондырғыларының тіркесімін қолдана отырып жұмыс істейді және тензорды өңдеу қондырғылары модельді шығаруды орталықтандыру үшін. Қорытынды модельді жаттықтыратын оқыту компонентін қолдану арқылы орталықтан жасалады.

Мақсатты модельдің айнымалылары мен күйі туралы ақпарат жергілікті жерде сақталады және олар бойынша бақылаулар процестің әр кезеңінде студентке жіберіледі. Сондай-ақ, SEED RL кідірісті азайту үшін әмбебап ашық бастапқы коэффициент негізіндегі желілік кітапхананы пайдаланады.

The Google зерттеушілері оқу компоненті деп айтты Автор: SEED RL мың ядроларға дейін кеңейтілуі мүмкін, қоршаған ортада өлшеу жүргізу және келесі әрекетті болжау үшін модель бойынша қорытынды жасау арасында қайталанатын актерлердің саны мыңдаған машиналарға дейін ұлғайтылуы мүмкін.

Google SEED RL тиімділігін оны танымал Arcade оқу ортасы, Google Research Football ортасы және әртүрлі DeepMind Lab орталарымен салыстыра отырып бағалады.Нәтижелері модельді секундына 2,4 миллион кадрға үйрету кезінде Google Research Football тапсырмасын шеше алғанын көрсетті. бұлтты тензорды өңдеу қондырғысының 64 чипін қолдану.

Бұл алдыңғы кадрлардан шамамен 80 есе жылдам, дейді Google.

«Бұл уақытты едәуір жеделдетуге айналады, өйткені үдеткіштер бір операция үшін процессорларға қарағанда әлдеқайда арзан, эксперименттердің құны күрт төмендейді». SEED RL және ұсынылған нәтижелер арматуралық оқыту үдеткішті қолдану тұрғысынан қалған терең біліммен тағы бір рет үлес қосқанын көрсетті деп санаймыз », - деп жазады Google Research компаниясының ғылыми-зерттеу инженері Ласе Эспехольт.

Заманауи үдеткіштерде қолдану үшін оңтайландырылған архитектурамен деректер тиімділігін арттыру мақсатында модельдің көлемін ұлғайту табиғи болып табылады.

Google SEED RL кодының ашық көзі және Github-та қол жетімді екенін айтты, оны Google Cloud-та графикалық өңдеу қондырғыларымен қалай жұмыс істеуге болатындығын көрсететін мысалдар келтірілген.

Соңында, жаңа құрылымға қызығушылық танытқандар үшін олар келесі сілтемеге өтіп, олар туралы көбірек ақпарат таба алады. Сілтеме бұл. 

Дерек көзі: https://ai.googleblog.com/


Мақаланың мазмұны біздің ұстанымдарымызды ұстанады редакторлық этика. Қате туралы хабарлау үшін нұқыңыз Мұнда.

Бірінші болып пікір айтыңыз

Пікіріңізді қалдырыңыз

Сіздің электрондық пошта мекен-жайы емес жарияланады. Міндетті өрістер таңбаланған *

*

*

  1. Деректерге жауапты: Мигель Анхель Гатан
  2. Деректердің мақсаты: СПАМ-ны басқару, түсініктемелерді басқару.
  3. Заңдылық: Сіздің келісіміңіз
  4. Деректер туралы ақпарат: заңды міндеттемелерді қоспағанда, деректер үшінші тұлғаларға жіберілмейді.
  5. Деректерді сақтау: Occentus Networks (ЕО) орналастырған мәліметтер базасы
  6. Құқықтар: Сіз кез-келген уақытта ақпаратты шектей, қалпына келтіре және жоя аласыз.