Google-k bere "TAPAS" AIren iturburu kodea kaleratu du

 

Google-k "TAPAS" iturburu kodea kaleratuko duela iragarri du (Taulen analisia), sare neuronala (Inteligentzia artifiziala) barnean garatu da hizkuntza naturalean galdera bati erantzuteko eta erantzuna datu base erlazional edo kalkulu orri batetik lortu.

TAPASen emaitzarik onenak lortzeko, proiektuaren ardura duten garatzaileek neurona sarea 6.2 milioi bikorekin entrenatzera dedikatu ziren taulatik Wikipediatik hartutako testura. Egiaztatzeko, sare neuronalak falta ziren hitzak leheneratu behar izan zituen bai tauletan eta bai trebatu gabeko testuetan. Berreskurapenaren zehaztasuna% 71,4 izan zen erreferentziako proba gisa erakutsi zuen neurona sareak hiru datu multzoetan aurkari algoritmoek baino erantzun zehatzak edo alderagarriak ematen dituela.

TAPASi buruz

funtsean proiektu honen ardatza informazioa kontsultatu, prozesatu eta erakutsi ahal izatea da erabiltzaileak hizkuntza naturalean egindako kontsultaren baldintzekin lotuta, informazioa lortzea eskala handian erraztuz.

TAPASen erabileraren oinarrizko adibidea erabiltzaile batek salmenten datuak, diru sarrerak, eskaerak, besteak beste. Horretaz gain, kontuan hartu behar duzu TAPAS datu-base batetik informazioa eskuratzera mugatzen ez ezik, kalkuluak egiteko gai ere bada, algoritmoak taulako gelaxketan erantzuna bilatzen du, bai zuzenean, bai gehikuntza, batez besteko eta beste eragile batzuen bidez, horrez gain, hainbat taulen arteko erantzuna aldi berean bila dezake.

Google-k Tapak Iturri Irekiko Hiru Algoritmoak gainditzen ditu edo bat egiten duela dio erlazio datuak aztertzeko. Tapak datu-biltegi handietatik elementu zehatzak ateratzeko gaitasuna erantzun-gaitasunak hobetzeko ere eman liteke.

Underhood, Tapak BERT hizkuntza naturalaren prozesatzeko teknikaren aldaera bat erabiltzen du Google motorrak egindako bilaketetan erabiltzen da.

BERTek ikuspegi tradizionalek baino zehaztasun handiagoa eskaintzen du izan ere, AI batek testu sekuentzia bat ebaluatzea ahalbidetzen du, ez bakarrik ezkerretik eskuinera edo eskuinetik ezkerrera ohikoa den moduan, baina biak aldi berean egiten ditu.

Google-k TAPASerako inplementatu duen bertsioak aukera ematen dio AIri erabiltzaileek egindako galdera eta kontsultatu nahi dituzten datuak ez ezik, datuak gordetzen dituzten erlazio taulen egitura ere kontuan hartzeko.

Nola instalatu TAPAS Linuxen?

izan ere, TAPAS funtsean BERT modeloa da eta, beraz, baldintza berdinak ditu. Horrek esan nahi du 512 sekuentziako luzera duen modelo handi bat trebatu daitekeela eta horrek TPU bat beharko du.

TAPAS Linuxen instalatu ahal izateko protokolo konpilatzailea behar dugu, Linux banaketa gehienetan aurki daitekeena.

Debian, Ubuntu eta horien deribatuetan, konpiladorea instalatu dezakegu komando honekin:

sudo apt-get install protobuf-compiler

Arch Linux, Manjaro, Arco Linux edo Arch Linux-en beste edozein deribatuen kasuan instalatzen dugu:

sudo pacman -S protobuf

Orain, TAPAS instalatzeko, iturburu kodea eskuratu eta komando hauekin konpilatzea besterik ez dugu:

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

Eta proba-suite exekutatzeko, deituz exekutatu daitekeen tox liburutegia erabiltzen dugu:

pip install tox
tox

Hemendik aurrera AI-k intereseko arloan trebatu beharko du. Hala ere eredu trebatu batzuk eskaintzen dira GitHub biltegian.

Horrez gain, konfigurazio aukera desberdinak erabil ditzakezu, adibidez gehienez_seq_length sekuentzia laburragoak sortzeko. Horrek zehaztasuna murriztuko du, baina GPU modeloa entrenagarria ere bihurtuko du. Beste aukera bat sortaren tamaina murriztea da (tren_lote_ tamaina), baina horrek ziurrenik ere eragina izango du.

Azkenean horri buruz gehiago jakin nahi baduzu AI honi buruz, erabileraren, exekuzioaren eta bestelako informazioaren xehetasunak kontsulta ditzakezu Hurrengo estekan.


Artikuluaren edukia gure printzipioekin bat dator etika editoriala. Akats baten berri emateko egin klik hemen.

Idatzi lehenengo iruzkina

Utzi zure iruzkina

Zure helbide elektronikoa ez da argitaratuko. Beharrezko eremuak markatuta daude *

*

*

  1. Datuen arduraduna: Miguel Ángel Gatón
  2. Datuen xedea: SPAM kontrolatzea, iruzkinen kudeaketa.
  3. Legitimazioa: Zure baimena
  4. Datuen komunikazioa: datuak ez zaizkie hirugarrenei jakinaraziko legezko betebeharrez izan ezik.
  5. Datuak biltegiratzea: Occentus Networks-ek (EB) ostatatutako datu-basea
  6. Eskubideak: Edonoiz zure informazioa mugatu, berreskuratu eta ezabatu dezakezu.