Google lëshoi ​​kodin burimor të AI "TAPAS"

Google njoftoi lëshimin e kodit burimor të "TAPAS" (PARSIMI I TABELS), një rrjet nervor (inteligjence artificiale) të zhvilluara brenda në mënyrë që t'i përgjigjen një pyetjeje në gjuhë natyrale dhe merrni përgjigjen nga një bazë e të dhënave relacionale ose fletëllogaritëse.

Në mënyrë që të merren rezultate optimale në TAPAS, zhvilluesit e ngarkuar me projektin iu përkushtuan trajnimit të rrjetit nervor me 6.2 milion çifte tabela në tekst marrë nga Wikipedia. Për të verifikuar, rrjeti nervor duhej të rivendoste fjalët që mungonin si në tabela ashtu edhe në tekstet në të cilat nuk ishte trajnuar. Saktësia e rikuperimit ishte 71,4% pasi një provë referimi tregoi se rrjeti nervor ofron përgjigje të sakta ose të krahasueshme sesa algoritmet rivale në të tre grupet e të dhënave.

Rreth TAPAS

në parim fokusi i këtij projekti është të jetë në gjendje të konsultohet, përpunojë dhe shfaqë informacionin lidhur me termat e pyetjes së bërë nga përdoruesi në gjuhën natyrore, duke lehtësuar në një shkallë të gjerë marrjen e informacionit.

Një shembull themelor i përdorimit të TAPAS është nëse një përdorues dëshiron të vlerësojë të dhënat e shitjeve, të ardhurat, kërkesat, ndër të tjera. Përveç kësaj, ju duhet të merrni parasysh atë TAPAS jo vetëm që është i kufizuar në marrjen e informacionit nga një bazë të dhënash, por është gjithashtu i aftë të kryejë llogaritjet, algoritmi kërkon përgjigjen në qelizat e tabelave, si drejtpërdrejt ashtu edhe me anë të shtesave, mesatareve dhe operatorëve të tjerë, përveç kësaj ai gjithashtu mund të kërkojë përgjigjen midis disa tabelave në të njëjtën kohë.

Google thotë që Tapas tejkalon ose përputhet me tre algoritmet kryesorë të burimit të hapur të analizojë të dhënat relacionale. Aftësia e Tapas për të nxjerrë sende të veçanta nga depot e mëdha të të dhënave mund të japë gjithashtu përmirësimin e aftësive të përgjigjes.

Nënshkrim, Tapas përdor një variant të teknikës së përpunimit të gjuhës natyrore BERT përdoret në kërkimet e kryera nga motori Google.

BERT ofron saktësi më të madhe se qasjet tradicionale sepse lejon një UA të vlerësojë një sekuencë teksti jo vetëm nga e majta në të djathtë ose nga e djathta në të majtë siç është praktika e zakonshme, por i bën të dyja në të njëjtën kohë.

Versioni që Google zbatoi për TAPAS lejon AI të marrë në konsideratë jo vetëm pyetjen e paraqitur nga përdoruesit dhe të dhënat që ata duan të kërkojnë, por edhe strukturën e tabelave relacionale në të cilat ruhen të dhënat.

Si të instaloni TAPAS në Linux?

duke ditur që TAPAS është në thelb një model BERT dhe për këtë arsye ka të njëjtat kërkesa. Kjo do të thotë që një model i madh mund të trajnohet me një gjatësi të sekuencës prej 512 që do të kërkojë një TPU.

Për të qenë në gjendje të instaloni TAPAS në Linux ne kemi nevojë për përpiluesin e protokollit, e cila mund të gjendet në shumicën e shpërndarjeve Linux.

Në Debian, Ubuntu dhe derivatet e këtyre, ne mund të instalojmë përpiluesin me komandën e mëposhtme:

sudo apt-get install protobuf-compiler

Në rastin e Arch Linux, Manjaro, Arco Linux ose ndonjë derivat tjetër të Arch Linux, ne instalojmë me:

sudo pacman -S protobuf

Tani që të jemi në gjendje të instalojmë TAPAS, ne thjesht duhet të marrim kodin burimor dhe të përpilojmë me komandat e mëposhtme:

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

Dhe për të ekzekutuar provën, ne përdorim bibliotekën tox e cila mund të ekzekutohet duke telefonuar:

pip install tox
tox

Nga këtu UA do të duhet të trajnohet në fushën e interesit. Megjithëse disa modele të trajnuara ofrohen në depon e GitHub.

Për më tepër, mund të përdorni mundësi të ndryshme konfigurimi, siç është opsioni gjatësia max_seq_ për të krijuar sekuenca më të shkurtra. Kjo do të zvogëlojë saktësinë, por gjithashtu do ta bëjë modelin GPU të trajnueshëm. Një tjetër mundësi është zvogëlimi i madhësisë së serisë (madhësia e trenit_batch), por kjo ka të ngjarë të ndikojë në saktësinë gjithashtu.

Më në fund nëse doni të dini më shumë rreth tij Në lidhje me këtë UA, ju mund të kontrolloni detajet e përdorimit, ekzekutimit dhe informacioneve të tjera Në lidhjen vijuese.


Lini komentin tuaj

Adresa juaj e emailit nuk do të publikohet. Fusha e kërkuar janë shënuar me *

*

*

  1. Përgjegjës për të dhënat: Miguel Ángel Gatón
  2. Qëllimi i të dhënave: Kontrolloni SPAM, menaxhimin e komenteve.
  3. Legjitimimi: Pëlqimi juaj
  4. Komunikimi i të dhënave: Të dhënat nuk do t'u komunikohen palëve të treta përveç me detyrim ligjor.
  5. Ruajtja e të dhënave: Baza e të dhënave e organizuar nga Occentus Networks (BE)
  6. Të drejtat: Në çdo kohë mund të kufizoni, rikuperoni dhe fshini informacionin tuaj.