SEED RL, oo ​​ah Qaab-furan Google Furan oo loogu talagalay Moodooyinka Sirdoonka Artificial

ka Baarayaasha Google ayaa lasii daayay wararka ku saabsan horumarinteeda qaab cusub oo fidiya tababarka moodooyinka sirdoonka macmalka ah ee kumanaan mishiinno ah. Natiijada ayaa loo yaqaan SEED RL (barashada xoojinta waxtarka leh ee qotodheer).

Tani waa horumar rajo leh maxaa yeelay waa inaan awood algorithms sirdoonka farsamada in la tababaray malaayiin images halkii labaad lana yareeyo kharashka ku baxa tababarkan 80%, ayay Google ku tiri warqad cilmi baaris ah.

Hoos u dhigista noocan ah waxay gacan ka geysan kartaa heerka garoonka ciyaarta ee bilowga. in illaa iyo hadda aysan awoodin inay la tartamaan kuwa ugu waaweyn sida Google ee goobta AI. Qiimaha tababarka moodooyinka barashada mashiinka casriga ee daruuraha ayaa si layaableh u sareeya. Google wuxuu qaabeeyaa furitaanka lambarka 'SEED RL code', mashruuc loogu talagalay hagaajinta qiimaha / waxqabadka saamiga ee xoojinta barashada.

Barashada xoojinta ayaa ah qaab adeegsi gaar ah oo adeegsi ah oo wakiiladu ay ku bartaan bay'adooda iyagoo u maraya sahaminta isla markaana ku hagaajinaya ficiladooda abaalmarinta ugu badan.

In »SEED RL: Jajaban oo hufan Deep-RL oo leh Xawaare Dhexe oo Dardar leh,” waxaan soo bandhignay wakiil RL ah oo miisaan u leh kumanaan mashiinno ah, kaas oo awood u siinaya tababarka malaayiin meeris ilbiriqsi oo si weyn u hagaajinaya waxtarka xisaabinta. Tan waxaa lagu gaaraa qaab dhismeed casri ah oo ka faa'iideysta dardar-galiyeyaasha (GPU ama TPU) marka loo eego iyada oo la xoojinayo habka tusaalaha iyo soo bandhigida lakab isgaarsiineed oo dhakhso leh.

Waxaan ku muujineynaa waxqabadka SEED RL heerarka caanka ah ee RL sida Google Research Football, Deegaanka Arcade Learning, iyo DeepMind Lab, waxaanna muujineynaa iyadoo la adeegsanayo moodello waaweyn, waxtarka xogta la kordhin karo. Koodhka ayaa laga furay Github oo ay weheliyaan tusaalooyin ku socda Google Cloud oo leh GPU.

SEED RL wuxuu ku saleysan yahay qaab dhismeedka TensorFlow 2.0 y waxay u shaqeysaa iyadoo la adeegsanayo iskudhaf cutubyada farsamada sawirada iyo unugyada farsameeya tensor-ka si ay u meel-mariyaan ka-hortagga tusaalaha Tixgelinta waxaa lagu sameeyaa bartamaha iyadoo la adeegsanayo qayb waxbarasho oo tababbaraysa tusaalaha.

Doorsoomayaasha iyo macluumaadka gobolka ee nooca bartilmaameedka ayaa lagu keydiyaa gudaha iyo u kuurgalida iyaga ayaa loo dirayaa ardayga marxalad kasta oo hawsha ka mid ah. SEED RL sidoo kale waxay isticmaashaa maktabad shabakadeed oo ku saleysan qaabka guud ee furan ee RPC si loo yareeyo daahitaanka.

ka Baarayaasha Google waxay sheegeen in qaybta waxbarashada by Afran Qalo waxaa lagu ballaarin karaa kumanaan jiir, halka tirada jilayaasha lagu celcelinayo inta u dhexeysa cabirka cabirada iyo fulinta fekerka tusaalaha si loo saadaaliyo tallaabada xigta, waa la qiyaasi karaa ilaa kumanaan mishiin.

Google waxay qiimeysay waxtarka SEED RL iyadoo la barbardhigay deegaanka caanka ah ee Arcade learning, Google Research Football deegaanka, iyo jawiyada kaladuwan ee DeepMind Lab. adoo adeegsanaya 2,4 jibbaar oo ah qalabka wax soo saarka dariiqa daruuriga.

Waxay qiyaastii 80 jeer ka dhakhso badan tahay qaababkii hore, ayuu yiri Google.

"Tani waxay u tarjumaysaa dardargelinta waqtiga muhiimka ah, maadaama xawaareyaashu ay aad uga jaban yihiin hawlgal kasta marka loo eego CPU-yada, qiimaha tijaabooyinka si aad ah ayaa loo dhimay." Waxaan rumeysan nahay in SEED RL iyo natiijooyinka la soo bandhigay ay muujinayaan in barashada xoojinta ay mar kale la qabsatay inta kale ee barashada qotoda dheer marka la eego isticmaalka xawaaraha, ”ayuu qoray Lasse Espeholt, Injineer Cilmi-baaris oo ka tirsan Google Research.

Iyada oo qaab dhismeedka loo habeeyay si loogu isticmaalo xawaareyaasha casriga ah, waa wax dabiici ah in la kordhiyo cabbirka qaabka iyadoo la isku dayayo in la kordhiyo waxtarka xogta.

Google wuxuu sheegay in nambarka SEED RL uu ahaa ilo furan oo laga heli karo Github, iyo sidoo kale tusaalooyin muujinaya sida loogu helo inay ka shaqeyso Google Cloud oo ay la socdaan cutubyo farsamo gacmeedyo.

Ugu dambeyntiina, kuwa xiiseynaya qaab-dhismeedkan cusub, waxay aadi karaan xiriirka soo socda halkaas oo ay ka heli karaan macluumaad dheeraad ah oo ku saabsan. Xiriiriyaha waa kan. 

source: https://ai.googleblog.com/


Ka tag faalladaada

cinwaanka email aan la daabacin doonaa. Beeraha loo baahan yahay waxaa lagu calaamadeeyay la *

*

*

  1. Masuul ka ah xogta: Miguel Ángel Gatón
  2. Ujeedada xogta: Xakamaynta SPAM, maaraynta faallooyinka.
  3. Sharci: Oggolaanshahaaga
  4. Isgaarsiinta xogta: Xogta looma gudbin doono dhinacyada saddexaad marka laga reebo waajibaadka sharciga ah.
  5. Kaydinta xogta: Macluumaadka ay martigelisay Shabakadaha Occentus (EU)
  6. Xuquuqda: Waqti kasta oo aad xadidi karto, soo ceshan karto oo tirtiri karto macluumaadkaaga.