SEED RL, e Google Open Source Framework fir kënschtlech Intelligenz Modeller

der Google Fuerscher verëffentlecht d'Neiegkeeten iwwer seng Entwécklung vun engem neie Kader, deen d'Ausbildung vu künstlechen Intelligenz Modeller op Dausende vu Maschinnen verlängert. D'Resultat gëtt genannt SEED RL (skalierbar effizient déif Verstäerkung léieren).

Dëst ass eng villverspriechend Entwécklung well ech soll erlaben Training kënschtlech Intelligenz Algorithmen op Millioune Biller pro Sekonn a reduzéiert d'Käschte vun dësem Training ëm 80%, sot Google an engem Fuerschungspabeier.

Dës Zort Ofbau kéint hëllefen d'Spillfeld fir Startups auszebauen. datt bis elo net fäeg waren mat den Haapt wéi Google am Feld AI ze konkurréiere. D'Käschte fir trainéiert sophistikéiert Maschinneléiere Modeller an der Wollek sinn iwwerraschend héich. Google formaliséiert d'Ouverture vum SEED RL Code, e Projet fir d'Käschten / Performance Verhältnis vum Verstäerkungsléieren ze optimiséieren.

Verstäerkung Léiere ass eng ganz spezifesch Usazfall Approche an där Agenten iwwer hir Ëmwelt léieren duerch Exploratioun an hir Handlungen optiméieren fir déi meescht Belounungen.

Am »SEED RL: Skalierbaren an Effiziente Deep-RL mat Accelerated Central Inference," hu mir en RL Agent agefouert, deen op Dausende vu Maschinnen ugeet, fir Training bei Millioune Frames pro Sekonn z'aktivéieren an d'computational Effizienz wesentlech ze verbesseren. Dëst gëtt mat enger neier Architektur erreecht déi Virdeeler vun Acceleratoren (GPU oder TPU) an der Skala profitéiert andeems d'Modelleféierung zentraliséiert an eng séier Kommunikatiounsschicht agefouert gëtt.

Mir demonstréieren SEED RL Performance op populäre RL Benchmarks wéi Google Research Football, Arcade Learning Environment, an DeepMind Lab, a weisen datt duerch méi grouss Modeller d'Dateneffizienz erhéicht ka ginn. De Code gouf op Github opgemaach zesumme mat Beispiller fir op Google Cloud mat GPU ze lafen.

SEED RL baséiert op dem TensorFlow 2.0 Framework y funktionnéiert mat enger Kombinatioun vu Grafikveraarbechtungseenheeten an Tensor Veraarbechtungseenheeten fir d'Modelleféierung zentraliséiert. Inferenz gëtt zentral gemaach mat engem Léierkomponent deen de Modell trainéiert.

D'Variabelen an d'Staatsinformatioun vum Zilmodell ginn lokal gespäichert an Observatiounen doriwwer ginn dem Student op all Etappe vum Prozess geschéckt. SEED RL benotzt och eng Netzwierkbibliothéik baséiert op dem universellen Open Source RPC Framework fir d'Latenz ze minimiséieren.

der Google Fuerscher hu gesot datt de Léierkomponent vum SEED RL kann op Dausende vu Käre erweidert ginn, wärend d'Zuel vun den Akteuren, déi widderholl ginn tëscht Moossnamen an der Ëmwelt an der Ausféierung vun enger Inferenz um Modell fir déi nächst Handlung virauszesoen, ka bis zu Dausende vu Maschinnen opgeholl ginn.

Google huet d'Effizienz vun SEED RL evaluéiert andeems se et mam populäre Arcade Léierëmfeld, Google Research Football Ëmfeld a verschiddene DeepMind Lab Ëmfeld vergläicht. Resultater weisen datt se et fäerdegbruecht hunn eng Google Research Football Aufgab ze léisen wärend se de Modell mat 2,4 Millioune Frames pro Sekonn trainéiert hunn. mat 64 Chips vun der Cloud Tensor Veraarbechtung Eenheet.

Et ass ongeféier 80 Mol méi séier wéi fréier Frames, sot Google.

"Dëst iwwersetzt sech an eng bedeitend Zäitbeschleunegung, well Beschleuniger si vill méi bëlleg pro Operatioun wéi CPUs, d'Käschte vun Experimenter ginn drastesch reduzéiert." Mir gleewen datt SEED RL an d'Resultater presentéiert weisen datt d'Verstäerkungsléiere nach eng Kéier de Rescht vum Deep Learning am Sënn vum Beschleuniger benotzt huet ", schreift Lasse Espeholt, Research Engineer bei Google Research.

Mat enger Architektur optimiséiert fir a modernen Acceleratoren ze benotzen, ass et natierlech d'Gréisst vum Modell ze erhéijen an engem Versuch d'Dateneffizienz ze erhéijen.

Google sot datt de SEED RL Code Open Source war a verfügbar op Github, wéi och Beispiller déi weisen wéi et op Google Cloud mat Grafikveraarbechtungseenheeten funktionnéiert.

Schlussendlech, fir déi, déi un dësem neie Kader interesséiert sinn, kënne se op de folgende Link goen, wou se méi Informatioun doriwwer fannen. De Link ass dëst. 

Source: https://ai.googleblog.com/


Den Inhalt vum Artikel hält sech un eis Prinzipie vun redaktionnell Ethik. Fir e Feeler ze mellen klickt hei.

Gitt d'éischt fir ze kommentéieren

Gitt Äre Kommentar

Är Email Adress gëtt net publizéiert ginn. Néideg Felder sinn markéiert mat *

*

*

  1. Responsabel fir d'Daten: Miguel Ángel Gatón
  2. Zweck vun den Donnéeën: Kontroll SPAM, Kommentarmanagement.
  3. Legitimatioun: Är Zoustëmmung
  4. Kommunikatioun vun den Donnéeën: D'Donnéeë ginn net un Drëttubidder matgedeelt ausser duerch legal Verpflichtung.
  5. Datenspeicher: Datebank gehost vun Occentus Networks (EU)
  6. Rechter: Zu all Moment kënnt Dir Är Informatioun limitéieren, recuperéieren an läschen.