SEED RL, Frèam Stòr Fosgailte Google airson modalan fiosrachaidh fuadain

a ' Luchd-rannsachaidh Google air an leigeil ma sgaoil na naidheachdan mu bhith a ’leasachadh frèam ùr a leudaicheas trèanadh mhodalan fiosrachaidh fuadain gu mìltean de dh’ innealan. Canar an toradh SEALLADH RL (ionnsachadh neartachaidh domhainn scalable èifeachdach).

Tha seo leasachadh gealltanach oir bu chòir dhomh comas a thoirt do algorithms fiosrachaidh fuadain a thrèanadh aig milleanan de dhealbhan gach diog agus cosgaisean an trèanaidh seo a lughdachadh 80%, thuirt Google ann am pàipear rannsachaidh.

Dh ’fhaodadh an seòrsa lughdachadh seo cuideachadh gus an raon cluiche a thòiseachadh airson ìrean tòiseachaidh. gu ruige seo cha robh e comasach dhaibh a bhith a ’farpais ris na prìomh fheadhainn mar Google ann an raon AI. Tha a ’chosgais airson a bhith a’ trèanadh mhodalan ionnsachaidh innealan sòghail san sgòth gu h-iongantach àrd. Tha Google a ’foirmealachadh fosgladh a’ chòd SEED RL, pròiseact a tha ag amas air a ’cho-mheas cosgais / coileanaidh a thaobh ionnsachadh ath-neartachaidh a bharrachadh.

Tha ionnsachadh ath-neartachaidh na dhòigh-obrach cleachdaidh sònraichte anns am bi riochdairean ag ionnsachadh mun àrainneachd aca tro sgrùdadh agus a ’dèanamh na gnìomhan as fheàrr airson na buannachdan as motha fhaighinn.

Ann an »SEED RL: Deep-RL Scalable agus Èifeachdach le Co-chruinneachadh Meadhan Luathaichte", thug sinn a-steach àidseant RL a bhios a ’sgèileadh gu mìltean de dh’ innealan, a ’comasachadh trèanadh aig milleanan de fhrèamaichean gach diog agus a’ leasachadh èifeachdas coimpiutaireachd gu mòr. Tha seo air a choileanadh le ailtireachd ùr-nodha a bhios a ’gabhail brath air luathadairean (GPU no TPU) aig sgèile le bhith a’ meadhanachadh co-dhùnadh modail agus a ’toirt a-steach còmhdach conaltraidh luath.

Bidh sinn a ’taisbeanadh coileanadh SEED RL air slatan-tomhais RL mòr-chòrdte leithid Google Research Football, Arcade Learning Environment, agus DeepMind Lab, agus a’ sealltainn le bhith a ’cleachdadh mhodalan nas motha, gun urrainnear èifeachdas dàta a mheudachadh. Chaidh an còd fhosgladh air Github còmhla ri eisimpleirean airson ruith air Google Cloud le GPU.

Tha SEED RL stèidhichte air frèam TensorFlow 2.0 y ag obair a ’cleachdadh measgachadh de aonadan giullachd grafaigs agus aonadan giullachd tensor gus co-dhùnadh modail a mheadhanachadh. Tha co-dhùnadh ga dhèanamh sa mheadhan a ’cleachdadh co-phàirt ionnsachaidh a bhios a’ trèanadh a ’mhodail.

Tha na caochladairean agus fiosrachadh stàite a ’mhodail targaid air an stòradh gu h-ionadail agus thèid beachdan mun deidhinn a chuir chun oileanach aig gach ìre den phròiseas. Bidh SEED RL cuideachd a ’cleachdadh leabharlann lìonra stèidhichte air frèam RPC uile-choitcheann stòr fosgailte gus latency a lughdachadh.

a ' Tha luchd-rannsachaidh Google air a ràdh gu bheil am pàirt ionnsachaidh le SEED RL faodar a leudachadh gu mìltean de choraichean, ged a dh ’fhaodadh an àireamh de chleasaichean a bhith air an ath-aithris eadar a bhith a’ dèanamh tomhasan san àrainneachd agus a ’dèanamh co-dhùnadh air a’ mhodail gus an ath ghnìomh a ro-innse, a bhith air an sgèile suas gu mìltean de dh ’innealan.

Rinn Google measadh air èifeachdas SEED RL le bhith ga choimeas ris an àrainneachd ionnsachaidh mòr-chòrdte Arcade, àrainneachd Ball-coise Rannsachaidh Google, agus diofar àrainneachdan DeepMind Lab. Tha toraidhean a ’sealltainn gun do shoirbhich leotha gus fuasgladh fhaighinn air gnìomh Ball-coise Rannsachaidh Google fhad‘ s a bha iad a ’trèanadh a’ mhodail aig 2,4 millean frèamaichean gach diog a ’cleachdadh 64 chips den aonad giullachd tensor sgòthan.

Tha e timcheall air 80 uair nas luaithe na frèamaichean roimhe, thuirt Google.

"Tha seo ag eadar-theangachadh gu luathachadh ùine mhòr, seach gu bheil luathadairean gu math nas saoire airson gach obrachadh na CPU, tha cosgais deuchainnean air a lùghdachadh gu mòr." Tha sinn den bheachd gu bheil SEED RL agus na toraidhean a chaidh a thaisbeanadh a ’sealltainn gu bheil ionnsachadh ath-neartachaidh a-rithist air grèim fhaighinn air a’ chòrr de dh ’ionnsachadh domhainn a thaobh cleachdadh luathaiche," sgrìobh Lasse Espeholt, innleadair rannsachaidh aig Google Research.

Le ailtireachd air a bharrrachadh airson a chleachdadh ann an luathadairean an latha an-diugh, tha e nàdarra meud a ’mhodail a mheudachadh ann an oidhirp èifeachdas dàta àrdachadh.

Thuirt Google gu robh an còd SEED RL fosgailte agus ri fhaighinn air Github, a bharrachd air eisimpleirean a ’sealltainn mar a gheibh thu e ag obair air Google Cloud le aonadan giullachd grafaigs.

Mu dheireadh, dhaibhsan aig a bheil ùidh san fhrèam ùr seo, faodaidh iad a dhol chun cheangal a leanas far am faigh iad barrachd fiosrachaidh mu dheidhinn. Is e seo an ceangal. 

Tobar: https://ai.googleblog.com/


Tha susbaint an artaigil a ’cumail ri na prionnsapalan againn de moraltachd deasachaidh. Gus aithris a dhèanamh air mearachd cliog an seo.

Bi a 'chiad fhear a thog beachd

Fàg do bheachd

Seòladh-d cha tèid fhoillseachadh.

*

*

  1. Uallach airson an dàta: Miguel Ángel Gatón
  2. Adhbhar an dàta: Smachd air SPAM, riaghladh bheachdan.
  3. Dìleab: Do chead
  4. Conaltradh an dàta: Cha tèid an dàta a thoirt do threas phàrtaidhean ach a-mhàin fo dhleastanas laghail.
  5. Stòradh dàta: Stòr-dàta air a chumail le Occentus Networks (EU)
  6. Còraichean: Aig àm sam bith faodaidh tu am fiosrachadh agad a chuingealachadh, fhaighinn air ais agus a dhubhadh às.