SEED RL, Adimen Artifizialeko Ereduetarako Google Iturburu Irekiko Esparrua

The Google ikertzaileek kaleratu dute adimen artifizialeko ereduen prestakuntza milaka makinetara zabaltzen duen esparru berri baten garapenari buruzko berria. Emaitza deitzen da HAZIA RL (indartze sakoneko ikaskuntza eraginkorra eta eskalagarria).

Hau da, etorkizun itxaropentsua behar nuelako adimen artifizialeko algoritmoak segundoko milioika iruditan trebatu daitezen eta prestakuntza horren kostuak% 80 murriztu direla esan du Google-k ikerketa batean.

Murrizketa mota honek hasierako joko eremua berdintzen lagun dezake. orain arte ezin izan dute Google bezalako nagusiekin AIren arloan lehiatu. Hodeian automatikoki ikasteko eredu sofistikatuak trebatzearen kostua harrigarria da. Google-k SEED RL kodea irekitzea formalizatzen du, errefortzu ikaskuntzaren kostua / errendimendua erlazioa optimizatzea helburu duen proiektua.

Errefortzuaren ikaskuntza erabilera kasu kasu zehatz bat da, agenteek esplorazioa medio beren ingurunea ezagutzeko eta beren ekintzak optimizatzeko sari gehien lortzeko.

»SEED RL: Inferentzia Zentral Azeleratuarekin Deep-RL eskalagarria eta eraginkorra" atalean, milaka makinatan eskalatzen duen RL agentea aurkeztu genuen, segundoko milioika fotogramatan trebakuntza ahalbidetuz eta konputazio efizientzia nabarmen hobetuz. Azeleragailuak (GPU edo TPU) eskalan aprobetxatzen dituen arkitektura berriari esker lortzen da ereduaren inferentzia zentralizatuz eta komunikazio geruza azkarra sartuz.

SEED RL errendimendua frogatzen dugu Google Research Football, Arcade Learning Environment eta DeepMind Lab bezalako RL erreferentzia ezagunetan, eta erakusten dugu eredu handiagoak erabiliz, datuen eraginkortasuna handitu daitekeela. Kodea Github-en ireki da Google Cloud-en GPU-rekin exekutatzeko adibideekin batera.

SEED RL TensorFlow 2.0 esparruan oinarritzen da y grafikoak prozesatzeko unitateen konbinazioa erabiliz funtzionatzen du eta tentsoreak prozesatzeko unitateak ereduaren inferentzia zentralizatzeko. Inferentzia eredu zentrala ikasteko osagai bat erabiliz egiten da.

Xede ereduaren aldagaiak eta egoera informazioa lokalean gordetzen dira eta haiei buruzko oharrak prozesuaren fase bakoitzean bidaltzen zaizkio ikasleari. SEED RL-k kode irekiko RPC esparru unibertsalean oinarritutako sareko liburutegia ere erabiltzen du latentzia minimizatzeko.

The Google ikertzaileek esan dute ikaskuntzaren osagaia dela egilea: SEED RL milaka nukleotara zabaldu daiteke, ingurunean neurketak egin eta hurrengo ekintza aurreikusteko ereduan inferentzia bat egin artean errepikatu beharreko aktore kopurua, berriz, milaka makinaraino igo daiteke.

Google-k SEED RLren eraginkortasuna ebaluatu zuen Arcade ikasteko ingurune ezagunarekin, Google Research Football ingurunearekin eta DeepMind Lab inguruneekin alderatuz. Emaitzek erakusten dute Google Research Football zeregina konpontzea lortu zutela modeloa 2,4 milioitan entrenatzen zuten bitartean. fotograma segundoko hodeiko tentsorea prozesatzeko unitatearen 64 txip erabiliz.

Googleren esanetan, aurreko fotogramak baino 80 aldiz azkarragoa da.

"Horrek denbora azelerazio nabarmena bihurtzen du, azeleragailuak eragiketa bakoitzeko CPUak baino askoz merkeagoak direnez, esperimentuen kostua izugarri murrizten da". Uste dugu SEED RL eta aurkeztutako emaitzek erakusten dutenez, indartze bidezko ikaskuntzak gainerako ikaskuntza sakonak atzeman ditu azeleragailuaren erabilerari dagokionez ", idazten du Lasse Espeholt-ek, Google Research-eko ikerketa ingeniariak.

Azeleragailu modernoetan erabiltzeko optimizatutako arkitektura batekin, naturala da ereduaren tamaina handitzea datuen eraginkortasuna handitu nahian.

Google-k esan du SEED RL kodea kode irekia zela eta Github-en eskuragarri zegoela, baita Google Cloud-en grafikoak prozesatzeko unitateekin nola funtzionatzen duen erakusten duten adibideak ere.

Azkenean, esparru berri honetan interesa dutenentzat, hurrengo estekara jo dezakete eta bertan informazio gehiago aurki dezakete. Esteka hau da. 

Fuente: https://ai.googleblog.com/


Artikuluaren edukia gure printzipioekin bat dator etika editoriala. Akats baten berri emateko egin klik hemen.

Idatzi lehenengo iruzkina

Utzi zure iruzkina

Zure helbide elektronikoa ez da argitaratuko. Beharrezko eremuak markatuta daude *

*

*

  1. Datuen arduraduna: Miguel Ángel Gatón
  2. Datuen xedea: SPAM kontrolatzea, iruzkinen kudeaketa.
  3. Legitimazioa: Zure baimena
  4. Datuen komunikazioa: datuak ez zaizkie hirugarrenei jakinaraziko legezko betebeharrez izan ezik.
  5. Datuak biltegiratzea: Occentus Networks-ek (EB) ostatatutako datu-basea
  6. Eskubideak: Edonoiz zure informazioa mugatu, berreskuratu eta ezabatu dezakezu.