Google a lansat codul sursă al AI „TAPAS”

Google a anunțat lansarea codului sursă al „TAPAS” (PARALIZARE TABLE), o rețea neuronală (inteligență artificială) dezvoltat intern pentru a răspunde la o întrebare în limbaj natural și obțineți răspunsul dintr-o bază de date relațională sau o foaie de calcul.

Pentru a obține rezultate optime în TAPAS, dezvoltatorii responsabili de proiect s-au dedicat instruirii rețelei neuronale cu 6.2 milioane de perechi tabel la text preluat din Wikipedia. Pentru a verifica, rețeaua neuronală a trebuit să restabilească cuvintele lipsă atât în ​​tabele, cât și în textele pe care nu fusese instruit. Precizia de recuperare a fost de 71,4% ca test de referință a arătat că rețeaua neuronală oferă răspunsuri exacte sau comparabile decât algoritmii rivali în toate cele trei seturi de date.

Despre TAPAS

fundamental obiectivul acestui proiect este să puteți consulta, procesa și afișa informații legate de termenii interogării făcute de utilizator în limbaj natural, facilitând pe scară largă obținerea de informații.

Un exemplu de bază al utilizării TAPAS este dacă un utilizator dorește să evalueze datele de vânzări, veniturile, solicitări, printre altele. În afară de asta, trebuie să țineți cont de asta TAPAS nu se limitează doar la obținerea de informații dintr-o bază de date, dar este, de asemenea, capabil să efectueze calcule, algoritmul caută răspunsul în celulele tabelului, atât direct, cât și prin adăugare, mediere și alți operatori, în plus, poate căuta și răspunsul între mai multe tabele în același timp.

Google spune că tapasul depășește sau se potrivește cu cei mai buni trei algoritmi open source pentru a analiza datele relaționale. Capacitatea tapas de a extrage elemente specifice din depozite mari de date s-ar putea dovedi, de asemenea, îmbunătățită a capacităților de răspuns.

Underhood, Tapas folosește o variantă a tehnicii de procesare a limbajului natural BERT utilizat în căutările efectuate de motorul Google.

BERT oferă o precizie mai mare decât abordările tradiționale deoarece permite unei AI să evalueze o secvență de text nu numai de la stânga la dreapta sau de la dreapta la stânga, așa cum este practica obișnuită, ci le face pe ambele în același timp.

Versiunea pe care Google a implementat-o ​​pentru TAPAS permite AI să ia în considerare nu numai întrebarea adresată de utilizatori și datele pe care doresc să le interoghe, ci și structura tabelelor relaționale în care sunt stocate datele.

Cum se instalează TAPAS pe Linux?

dat fiind faptul că TAPAS este în esență un model BERT și, prin urmare, are aceleași cerințe. Aceasta înseamnă că un model mare poate fi antrenat cu o lungime a secvenței de 512, care va necesita un TPU.

Pentru a putea instala TAPAS pe Linux avem nevoie de compilatorul de protocol, care poate fi găsit în majoritatea distribuțiilor Linux.

În Debian, Ubuntu și derivatele acestora, putem instala compilatorul cu următoarea comandă:

sudo apt-get install protobuf-compiler

În cazul Arch Linux, Manjaro, Arco Linux sau orice alt derivat al Arch Linux, instalăm cu:

sudo pacman -S protobuf

Acum, pentru a putea instala TAPAS, trebuie doar să obținem codul sursă și să realizăm compilarea cu următoarele comenzi:

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

Și pentru a rula suita de testare, utilizăm biblioteca tox care poate fi rulată apelând:

pip install tox
tox

De aici, AI va trebui să fie instruit în domeniul de interes. Deşi unele modele instruite sunt oferite în depozitul GitHub.

În plus, puteți utiliza diferite opțiuni de configurare, cum ar fi opțiunea max_seq_length pentru a crea secvențe mai scurte. Acest lucru va reduce precizia, dar va face și modelul GPU-antrenabil. O altă opțiune este reducerea dimensiunii lotului (dimensiunea_lotului_trenului), dar acest lucru va afecta probabil și acuratețea.

În cele din urmă, dacă doriți să aflați mai multe despre asta Despre acest AI, puteți verifica detaliile de utilizare, execuție și alte informații În următorul link.


Lasă comentariul tău

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

*

*

  1. Responsabil pentru date: Miguel Ángel Gatón
  2. Scopul datelor: Control SPAM, gestionarea comentariilor.
  3. Legitimare: consimțământul dvs.
  4. Comunicarea datelor: datele nu vor fi comunicate terților decât prin obligație legală.
  5. Stocarea datelor: bază de date găzduită de Occentus Networks (UE)
  6. Drepturi: în orice moment vă puteți limita, recupera și șterge informațiile.