Google frigav kildekoden til sin AI "TAPAS"

Google annoncerede frigivelsen af ​​kildekoden til "TAPAS" (TABELLERING), et neuralt netværk (kunstig intelligens) udviklet internt for at besvare et spørgsmål på et naturligt sprog og få svaret fra en relationsdatabase eller et regneark.

For at opnå optimale resultater i TAPAS, udviklerne med ansvar for projektet dedikerede sig til at træne det neurale netværk med 6.2 millioner par fra tabel til tekst taget fra Wikipedia. For at bekræfte, var det neurale netværk nødt til at gendanne de manglende ord både i tabellerne og i de tekster, hvor det ikke var blevet trænet. Genopretningspræcisionen var 71,4% som en benchmark test viste, at det neurale netværk giver nøjagtige eller sammenlignelige svar end rivaliserende algoritmer i alle tre datasæt.

Om TAPAS

dybest set fokus for dette projekt er at kunne konsultere, behandle og vise information relateret til vilkårene i forespørgslen fra brugeren på naturligt sprog, hvilket i stor skala letter indhentning af information.

Et grundlæggende eksempel på brugen af ​​TAPAS er, hvis en bruger ønsker at evaluere salgsdata, indtægter, anmoder blandt andet om. Derudover skal du tage højde for det TAPAS er ikke kun begrænset til at indhente oplysninger fra en database, men det er også i stand til at udføre beregninger, ser algoritmen efter svaret i tabelcellerne, både direkte og ved hjælp af addition, middelværdi og andre operatorer, ud over at det også kan se efter svaret mellem flere tabeller på samme tid.

Google siger, at tapas overgår eller matcher de tre bedste open source-algoritmer at analysere relationelle data. Tapas evne til at udtrække specifikke emner fra store datalagre kunne også egne sig til forbedring af responsfunktioner.

Underhood, Tapas anvender en variation af BERT-teknikken til naturlig sprogbehandling bruges i søgninger foretaget af Google-motoren.

BERT giver større præcision end traditionelle tilgange fordi det giver en AI mulighed for at evaluere en tekstsekvens ikke kun fra venstre til højre eller højre mod venstre, som det er den sædvanlige praksis, men gør begge dele på samme tid.

Den version, som Google implementerede til TAPAS, giver AI mulighed for ikke kun at overveje det spørgsmål, der stilles af brugerne, og de data, de ønsker at forespørge om, men også strukturen i de relationelle tabeller, hvor dataene er gemt.

Hvordan installeres TAPAS på Linux?

betragtning af, at TAPAS er i det væsentlige en BERT-model og har derfor de samme krav. Dette betyder, at en stor model med en sekvenslængde på 512 kan trænes, hvilket kræver en TPU.

At kunne installere TAPAS på Linux vi har brug for protokol-kompilatoren, som kan findes på de fleste Linux-distributioner.

I Debian, Ubuntu og derivater af disse kan vi installere compileren med følgende kommando:

sudo apt-get install protobuf-compiler

I tilfælde af Arch Linux, Manjaro, Arco Linux eller andre afledte af Arch Linux installerer vi med:

sudo pacman -S protobuf

For at installere TAPAS skal vi bare hente kildekoden og kompilere med følgende kommandoer:

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

Og for at køre testpakken bruger vi toksbiblioteket, som kan køres ved at ringe:

pip install tox
tox

Herfra skal AI trænes i det interesseområde. Selvom nogle uddannede modeller tilbydes i GitHub-arkivet.

Derudover kan du bruge forskellige konfigurationsindstillinger, såsom indstillingen max_seq_length for at oprette kortere sekvenser. Dette vil reducere nøjagtigheden, men vil også gøre model GPU træningsbar. En anden mulighed er at reducere batchstørrelsen (tog_batch_størrelse), men dette vil sandsynligvis også påvirke nøjagtigheden.

Endelig hvis du vil vide mere om det Om denne AI kan du kontrollere detaljerne om brug, udførelse og anden information I det følgende link.


Efterlad din kommentar

Din e-mailadresse vil ikke blive offentliggjort. Obligatoriske felter er markeret med *

*

*

  1. Ansvarlig for dataene: Miguel Ángel Gatón
  2. Formålet med dataene: Control SPAM, management af kommentarer.
  3. Legitimering: Dit samtykke
  4. Kommunikation af dataene: Dataene vil ikke blive kommunikeret til tredjemand, undtagen ved juridisk forpligtelse.
  5. Datalagring: Database hostet af Occentus Networks (EU)
  6. Rettigheder: Du kan til enhver tid begrænse, gendanne og slette dine oplysninger.