SEED RL, un cadru open source Google pentru modele de inteligență artificială

L Cercetătorii Google au lansat noutățile despre dezvoltarea unui nou cadru care extinde instruirea modelului de inteligență artificială la mii de mașini. Rezultatul se numește SEMINTA RL (învățare scalabilă eficientă de consolidare profundă).

Acest lucru este o dezvoltare promițătoare pentru că ar trebui permite algoritmilor de inteligență artificială să fie instruiți la milioane de imagini pe secundă și reduce costurile acestei instruiri cu 80%, a spus Google într-o lucrare de cercetare.

Acest tip de reducere ar putea ajuta la nivelarea terenului de joc pentru startup-uri. care până acum nu au reușit să concureze cu principalele ca Google în domeniul AI. Costul instruirii modelelor sofisticate de învățare automată în cloud este surprinzător de ridicat. Google formalizează deschiderea codului SEED RL, un proiect care vizează optimizarea raportului cost / performanță al învățării cu întărire.

Învățarea prin întărire este o abordare foarte specifică a cazurilor de utilizare în care agenții învață despre mediul lor prin explorare și își optimizează acțiunile pentru a obține cele mai multe recompense.

În »SEED RL: Deep-RL scalabil și eficient cu inferență centrală accelerată", am introdus un agent RL care se adaptează la mii de mașini, permițând formarea la milioane de cadre pe secundă și îmbunătățind semnificativ eficiența de calcul. Acest lucru se realizează cu o arhitectură nouă care profită de acceleratoare (GPU sau TPU) la scară prin centralizarea inferenței modelului și prin introducerea unui strat de comunicare rapid.

Demonstrăm performanța SEED RL pe reperele populare RL, cum ar fi Google Research Football, Arcade Learning Environment și DeepMind Lab, și demonstrăm că prin utilizarea unor modele mai mari, eficiența datelor poate fi crescută. Codul a fost deschis pe Github împreună cu exemple pentru a rula pe Google Cloud cu GPU.

SEED RL se bazează pe cadrul TensorFlow 2.0 y funcționează folosind o combinație de unități de procesare grafică și unități de procesare a tensorului pentru a centraliza inferența modelului. Inferența se face central folosind o componentă de învățare care antrenează modelul.

Variabilele și informațiile de stare ale modelului țintă sunt stocate local iar observațiile asupra acestora sunt trimise elevului în fiecare etapă a procesului. SEED RL folosește și o bibliotecă de rețea bazată pe cadrul RPC universal open source pentru a minimiza latența.

L Cercetătorii Google au spus că componenta învățării de SEED RL poate fi extins la mii de nuclee, în timp ce numărul de actori care trebuie repetat între efectuarea măsurătorilor în mediul înconjurător și executarea unei inferențe asupra modelului pentru a prezice următoarea acțiune, poate fi scalat până la mii de mașini.

Google a evaluat eficacitatea SEED RL comparându-l cu mediul popular de învățare Arcade, mediul Google Research Football și diverse medii DeepMind Lab. Rezultatele arată că au reușit să rezolve o sarcină Google Football Football în timp ce dresează modelul la 2,4 milioane cadre pe secundă folosind 64 de cipuri ale unității de procesare a tensorului în cloud.

Este de aproximativ 80 de ori mai rapid decât cadrele anterioare, a spus Google.

„Aceasta se traduce printr-o accelerare semnificativă a timpului, deoarece acceleratoarele sunt mult mai ieftine pe operație decât procesoarele, costul experimentelor este redus drastic.” Credem că SEED RL și rezultatele prezentate arată că învățarea prin consolidare a prins din nou restul învățării profunde în ceea ce privește utilizarea acceleratorului ", scrie Lasse Espeholt, inginer cercetător la Google Research.

Cu o arhitectură optimizată pentru utilizare în acceleratoarele moderne, este firesc să crești dimensiunea modelului, în încercarea de a crește eficiența datelor.

Google a spus că codul SEED RL era open source și disponibil pe Github, precum și exemple care arată cum să funcționeze pe Google Cloud cu unități de procesare grafică.

În cele din urmă, pentru cei interesați de acest nou cadru, pot accesa următorul link unde pot găsi mai multe informații despre acesta. Legătura este aceasta. 

Fuente: https://ai.googleblog.com/


Fii primul care comenteaza

Lasă comentariul tău

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

*

*

  1. Responsabil pentru date: Miguel Ángel Gatón
  2. Scopul datelor: Control SPAM, gestionarea comentariilor.
  3. Legitimare: consimțământul dvs.
  4. Comunicarea datelor: datele nu vor fi comunicate terților decât prin obligație legală.
  5. Stocarea datelor: bază de date găzduită de Occentus Networks (UE)
  6. Drepturi: în orice moment vă puteți limita, recupera și șterge informațiile.