SEED RL, en Google Open Source Framework til kunstig intelligensmodeller

masse Google-forskere frigivet nyheden om dens udvikling af en ny ramme, der udvider uddannelsen af ​​kunstig intelligensmodeller til tusindvis af maskiner. Resultatet kaldes FRØ RL (skalerbar effektiv dyb forstærkningslæring).

Dette er en lovende udvikling fordi jeg skulle gøre det muligt at træne kunstig intelligensalgoritmer med millioner af billeder i sekundet og reducere omkostningerne ved denne træning med 80%, sagde Google i en forskningsartikel.

Denne form for nedskæringer kan hjælpe med at skabe lige vilkår for startups. der indtil nu ikke har været i stand til at konkurrere med de vigtigste som Google inden for AI. Omkostningerne ved at træne sofistikerede maskinlæringsmodeller i skyen er overraskende høje. Google formaliserer åbningen af ​​SEED RL-koden, et projekt der sigter mod at optimere forholdet mellem omkostninger og ydelse ved forstærkningslæring.

Forstærkningslæring er en meget specifik use-case-tilgang, hvor agenter lærer om deres miljø gennem udforskning og optimerer deres handlinger for at opnå de mest belønninger.

I »SEED RL: Skalerbar og effektiv Deep-RL med accelereret central inferens" introducerede vi en RL-agent, der skaleres til tusindvis af maskiner, hvilket muliggør træning i millioner af billeder pr. Sekund og forbedrer beregningseffektiviteten betydeligt. Dette opnås med en ny arkitektur, der drager fordel af acceleratorer (GPU eller TPU) i skala ved at centralisere modelinferens og indføre et hurtigt kommunikationslag.

Vi demonstrerer SEED RL-ydeevne på populære RL-benchmarks såsom Google Research Football, Arcade Learning Environment og DeepMind Lab og viser, at ved at bruge større modeller kan dataeffektiviteten øges. Koden er blevet åbnet på Github sammen med eksempler til at køre på Google Cloud med GPU.

SEED RL er baseret på TensorFlow 2.0-rammen y fungerer ved hjælp af en kombination af grafikbehandlingsenheder og tensorbehandlingsenheder til centralisering af modelinferens. Inferens udføres centralt ved hjælp af en læringskomponent, der træner modellen.

Variablerne og tilstandsoplysningerne for målmodellen lagres lokalt og observationer om dem sendes til den studerende på hvert trin i processen. SEED RL bruger også et netværksbibliotek baseret på den universelle open source RPC-ramme for at minimere latenstid.

masse Google-forskere har sagt, at læringskomponenten af SEED RL kan udvides til tusindvis af kerner, mens antallet af aktører, der skal gentages mellem målinger i miljøet og udførelse af en slutning på modellen for at forudsige den næste handling, kan skaleres op til tusindvis af maskiner.

Google evaluerede effektiviteten af ​​SEED RL ved at sammenligne det med det populære Arcade-læringsmiljø, Google Research Football-miljøet og forskellige DeepMind Lab-miljøer. Resultaterne viste, at det lykkedes dem at løse en Google Research Football-opgave, mens de træner modellen til 2,4 millioner billeder pr. sekund ved hjælp af 64 chips fra cloud tensor-behandlingsenheden.

Det er omkring 80 gange hurtigere end tidligere billeder, sagde Google.

"Dette betyder en betydelig tidsacceleration, da acceleratorer er meget billigere pr. Operation end CPU'er, og omkostningerne ved eksperimenter reduceres drastisk." Vi mener, at SEED RL og de præsenterede resultater viser, at forstærkningslæring igen har fanget resten af ​​dyb læring med hensyn til acceleratorbrug, "skriver Lasse Espeholt, forskningsingeniør hos Google Research.

Med en arkitektur, der er optimeret til brug i moderne acceleratorer, er det naturligt at øge størrelsen på modellen i et forsøg på at øge dataeffektiviteten.

Google sagde, at SEED RL-koden var open source og tilgængelig på Github, samt eksempler, der viser, hvordan du får det til at arbejde på Google Cloud med grafikbehandlingsenheder.

Endelig kan de, der er interesseret i denne nye ramme, gå til følgende link, hvor de kan finde mere information om det. Linket er dette. 

kilde: https://ai.googleblog.com/


Vær den første til at kommentere

Efterlad din kommentar

Din e-mailadresse vil ikke blive offentliggjort. Obligatoriske felter er markeret med *

*

*

  1. Ansvarlig for dataene: Miguel Ángel Gatón
  2. Formålet med dataene: Control SPAM, management af kommentarer.
  3. Legitimering: Dit samtykke
  4. Kommunikation af dataene: Dataene vil ikke blive kommunikeret til tredjemand, undtagen ved juridisk forpligtelse.
  5. Datalagring: Database hostet af Occentus Networks (EU)
  6. Rettigheder: Du kan til enhver tid begrænse, gendanne og slette dine oplysninger.