Google tu koodu orisun ti AI "TAPAS" rẹ silẹ

 

Google kede ikede ti koodu orisun ti "TAPAS" (ParSing tabili), a nkankikan nẹtiwọki (oye atọwọda) dagbasoke ni inu lati le dahun ibeere kan ni ede abinibi ati ki o gba idahun lati ibi ipamọ data ibatan tabi kaunti.

Lati le gba awọn abajade to dara julọ ni TAPAS, awọn Difelopa ti o ṣakoso iṣẹ naa ṣe iyasọtọ ara wọn si ikẹkọ nẹtiwọọki ti ara pẹlu 6.2 million orisii tabili si ọrọ ti o ya lati Wikipedia. Lati rii daju, nẹtiwọọki ti ara ni lati mu awọn ọrọ ti o padanu pada sipo mejeeji ninu awọn tabili ati ninu awọn ọrọ ti ko ti ni ikẹkọ lori. Pipe imularada jẹ 71,4% bi idanwo aṣepari fihan pe nẹtiwọọki nọnu n pese awọn idahun deede tabi awọn afiwera ju awọn alugoridimu orogun ni gbogbo awọn ipilẹ data mẹta.

Nipa TAPAS

Ni ipilẹ idojukọ ti iṣẹ yii ni lati ni anfani lati ni imọran, ilana ati ifihan alaye ni ibatan si awọn ofin ti ibeere ti olumulo ṣe ni ede abinibi, dẹrọ ni ipele nla gbigba alaye.

Apẹẹrẹ ipilẹ ti lilo ti TAPAS ni ti olumulo kan ba fẹ ṣe iṣiro data tita, owo-ori, awọn ibeere, laarin awọn ohun miiran. Yato si pe o ni lati ṣe akiyesi iyẹn TAPAS ko ni opin si gbigba alaye nikan lati ibi ipamọ data kan, ṣugbọn o tun lagbara lati ṣe awọn iṣiro, algorithm n wa idahun ni awọn sẹẹli tabili, mejeeji taara ati nipasẹ afikun, apapọ ati awọn oniṣẹ miiran, ni afikun si pe o tun le wa idahun laarin awọn tabili pupọ ni akoko kanna.

Google Wipe Awọn Tapa Awọn Tapa tabi baamu Awọn aligoridimu Orisun Mẹta Ṣi lati ṣe itupalẹ data ibatan. Agbara Tapas lati jade awọn eroja pataki lati awọn ibi ipamọ data nla le tun ya ararẹ si imudarasi awọn agbara idahun.

Labẹ, Tapas lo iyatọ ti imọ-ẹrọ processing ede abinibi BERT lo ninu awọn wiwa ti ẹrọ Google ṣe.

BERT n pese pipe ti o tobi ju awọn ọna abayọ lọ nitori pe o gba AI laaye lati ṣe iṣiro itẹlera ọrọ kii ṣe lati osi si ọtun tabi sọtun si apa osi bi iṣe deede, ṣugbọn ṣe mejeeji ni akoko kanna.

Ẹya ti Google ṣe fun TAPAS gba AI laaye lati ṣe akiyesi kii ṣe ibeere ti awọn olumulo ṣe nikan ati data ti wọn fẹ lati beere, ṣugbọn tun eto ti awọn tabili ibatan ti o wa ninu data naa.

Bii o ṣe le fi TAPAS sori Linux?

Niwon TAPAS jẹ pataki awoṣe BERT ati nitorinaa ni awọn ibeere kanna. Eyi tumọ si pe awoṣe nla kan le ni ikẹkọ pẹlu gigun ọkọọkan ti 512 eyiti yoo nilo TPU kan.

Lati ni anfani lati fi TAPAS sori ẹrọ Linux a nilo alapọpọ ilana, eyiti o le rii ni ọpọlọpọ awọn pinpin kaakiri Linux.

Ni Debian, Ubuntu ati awọn itọsẹ ti iwọnyi, a le fi olupilẹṣẹ sori ẹrọ pẹlu aṣẹ atẹle:

sudo apt-get install protobuf-compiler

Ninu ọran Arch Linux, Manjaro, Arco Linux tabi itọsẹ miiran ti Arch Linux, a fi sii pẹlu:

sudo pacman -S protobuf

Bayi lati ni anfani lati fi TAPAS sori ẹrọ, a ni lati gba koodu orisun nikan ati lati ṣe akopọ pẹlu awọn ofin wọnyi:

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

Ati lati ṣiṣe suite idanwo, a lo ile-ikawe tox eyiti o le ṣiṣẹ nipasẹ pipe:

pip install tox
tox

Lati ibi AI yoo ni lati ni ikẹkọ ni agbegbe ti iwulo. Tilẹ diẹ ninu awọn awoṣe ti a kọ ni a nṣe ni ibi ipamọ GitHub.

Ni afikun, o le lo awọn aṣayan iṣeto oriṣiriṣi, gẹgẹbi aṣayan max_seq_length lati ṣẹda awọn itẹlera kukuru. Eyi yoo dinku deede ṣugbọn yoo tun jẹ awoṣe GPU-trainable. Aṣayan miiran ni lati dinku iwọn ipele (reluwe_batch_size), ṣugbọn eyi yoo ṣeese yoo ni ipa deede.

Lakotan ti o ba fẹ lati mọ diẹ sii nipa rẹ Nipa AI yii, o le ṣayẹwo awọn alaye ti lilo, ipaniyan ati alaye miiran Ni ọna asopọ atẹle.


Awọn akoonu ti nkan naa faramọ awọn ilana wa ti awọn ilana olootu. Lati jabo aṣiṣe kan tẹ nibi.

Jẹ akọkọ lati sọ ọrọ

Fi ọrọ rẹ silẹ

Adirẹsi imeeli rẹ yoo ko le ṣe atejade. O beere aaye ti wa ni samisi pẹlu *

*

*

  1. Lodidi fun data naa: Miguel Ángel Gatón
  2. Idi ti data naa: SPAM Iṣakoso, iṣakoso ọrọ asọye.
  3. Ofin: Iyọọda rẹ
  4. Ibaraẹnisọrọ data: Awọn data kii yoo ni ifọrọhan si awọn ẹgbẹ kẹta ayafi nipasẹ ọranyan ofin.
  5. Ibi ipamọ data: Alaye data ti o gbalejo nipasẹ Awọn nẹtiwọọki Occentus (EU)
  6. Awọn ẹtọ: Ni eyikeyi akoko o le ni opin, gba pada ki o paarẹ alaye rẹ.