Google zverejnil zdrojový kód svojho AI „TAPAS“

Google oznámil vydanie zdrojového kódu produktu „TAPAS“ (parSovanie tabuľky), neurónová sieť (umela inteligencia) interne vyvinuté s cieľom odpovedať na otázku v prirodzenom jazyku a získate odpoveď z relačnej databázy alebo tabuľky.

S cieľom dosiahnuť optimálne výsledky v systéme TAPAS, vývojári zodpovední za projekt sa venovali trénovaniu neurónovej siete s 6.2 miliónmi párov tabuľka na text prevzatý z Wikipédie. Na overenie musela neurónová sieť obnoviť chýbajúce slová v tabuľkách aj v textoch, v ktorých nebola trénovaná. Presnosť zotavenia bola 71,4% ako test ukázal, že neurónová sieť poskytuje presné alebo porovnateľné odozvy ako konkurenčné algoritmy vo všetkých troch súboroch údajov.

O spoločnosti TAPAS

v podstate zameraním tohto projektu je schopnosť konzultovať, spracovávať a zobrazovať informácie súvisiace s podmienkami dotazu, ktorý používateľ urobil v prirodzenom jazyku, čo vo veľkom rozsahu uľahčuje získavanie informácií.

Základným príkladom použitia systému TAPAS je, ak chce používateľ vyhodnotiť údaje o predaji, príjmy, okrem iného žiada. Okrem toho musíte vziať do úvahy, že TAPAS sa neobmedzuje iba na získavanie informácií z databázy, ale je schopný vykonávať aj výpočty, algoritmus hľadá odpoveď v bunkách tabuľky, priamo aj pomocou sčítania, spriemerovania a ďalších operátorov, okrem toho môže hľadať aj odpoveď medzi niekoľkými tabuľkami súčasne.

Spoločnosť Google tvrdí, že Tapas prekonáva alebo sa zhoduje s prvými tromi algoritmami otvoreného zdroja analyzovať relačné údaje. Schopnosť spoločnosti Tapas extrahovať konkrétne prvky z veľkých úložísk údajov by sa tiež mohla hodiť na zlepšenie schopností odpovedať.

Underhood, Spoločnosť Tapas využíva variácie techniky spracovania prirodzeného jazyka BERT použité pri vyhľadávaní uskutočňovaných vyhľadávačom Google.

BERT poskytuje väčšiu presnosť ako tradičné prístupy pretože umožňuje AI vyhodnotiť textovú sekvenciu nielen zľava doprava alebo sprava doľava, ako je to obvyklé, ale robí to súčasne.

Verzia, ktorú Google implementoval pre TAPAS, umožňuje AI zohľadniť nielen otázku položenú používateľmi a údajmi, ktoré chcú vyhľadávať, ale aj štruktúru relačných tabuliek, v ktorých sú údaje uložené.

Ako nainštalovať TAPAS na Linuxe?

vzhľadom na to, že TAPAS je v podstate model BERT, a preto má rovnaké požiadavky. To znamená, že je možné trénovať veľký model s dĺžkou sekvencie 512, ktorá bude vyžadovať TPU.

Aby bolo možné nainštalovať TAPAS na Linux požadujeme prekladač protokolov, ktoré možno nájsť vo väčšine distribúcií Linuxu.

V Debiane, Ubuntu a ich derivátoch môžeme kompilátor nainštalovať pomocou nasledujúceho príkazu:

sudo apt-get install protobuf-compiler

V prípade Arch Linuxu, Manjaro, Arco Linuxu alebo iného derivátu Arch Linuxu inštalujeme s:

sudo pacman -S protobuf

Teraz, aby sme mohli nainštalovať TAPAS, musíme len získať zdrojový kód a skompilovať ho pomocou nasledujúcich príkazov:

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

A na spustenie testovacej sady používame knižnicu tox, ktorú je možné spustiť volaním:

pip install tox
tox

Od tejto chvíle bude musieť byť AI trénovaná v záujmovej oblasti. Predsa niektoré trénované modely sú ponúkané v úložisku GitHub.

Okrem toho môžete použiť rôzne možnosti konfigurácie, napríklad túto možnosť max_seq_length na vytvorenie kratších sekvencií. Zníži sa tým presnosť, ale model sa dá trénovať aj pomocou GPU. Ďalšou možnosťou je zmenšiť veľkosť dávky (veľkosť_dávky vlaku), ale to pravdepodobne ovplyvní aj presnosť.

Nakoniec, ak sa chcete o tom dozvedieť viac O tejto AI môžete skontrolovať podrobnosti použitia, vykonania a ďalšie informácie Na nasledujúcom odkaze.


Zanechajte svoj komentár

Vaša e-mailová adresa nebude zverejnená. Povinné položky sú označené *

*

*

  1. Zodpovedný za údaje: Miguel Ángel Gatón
  2. Účel údajov: Kontrolný SPAM, správa komentárov.
  3. Legitimácia: Váš súhlas
  4. Oznamovanie údajov: Údaje nebudú poskytnuté tretím stranám, iba ak to vyplýva zo zákona.
  5. Ukladanie dát: Databáza hostená spoločnosťou Occentus Networks (EU)
  6. Práva: Svoje údaje môžete kedykoľvek obmedziť, obnoviť a vymazať.