Google heeft de broncode van zijn AI "TAPAS" vrijgegeven

Google kondigde de release aan van de broncode van "TAPAS" (TABEL PArSing), een neuraal netwerk (kunstmatige intelligentie) intern ontwikkeld om een ​​vraag in natuurlijke taal te beantwoorden en haal het antwoord uit een relationele database of spreadsheet.

Om optimale resultaten in TAPAS te verkrijgen, de ontwikkelaars die verantwoordelijk waren voor het project, hebben zich toegelegd op het trainen van het neurale netwerk met 6.2 miljoen paren van tabel naar tekst uit Wikipedia. Om dit te verifiëren, moest het neurale netwerk ontbrekende woorden herstellen, zowel in de tabellen als in de teksten waarop het niet was getraind. De herstelprecisie was 71,4% als een benchmarktest toonde aan dat het neurale netwerk nauwkeurige of vergelijkbare reacties geeft dan rivaliserende algoritmen in alle drie de datasets.

Over TAPAS

in principe de focus van dit project is het kunnen raadplegen, verwerken en tonen van informatie gerelateerd aan de termen van de vraag die de gebruiker in natuurlijke taal heeft gesteld, waardoor het op grote schaal verkrijgen van informatie wordt vergemakkelijkt.

Een eenvoudig voorbeeld van het gebruik van TAPAS is als een gebruiker verkoopgegevens, inkomen, verzoeken, onder andere. Daarnaast moet je daar rekening mee houden TAPAS beperkt zich niet alleen tot het verkrijgen van informatie uit een database, maar kan ook berekeningen uitvoeren, zoekt het algoritme naar het antwoord in de tabelcellen, zowel direct als door middel van optellen, middelen en andere operatoren, daarnaast kan het ook het antwoord zoeken tussen meerdere tabellen tegelijk.

Google zegt dat Tapas beter presteert dan of overeenkomt met de drie beste open source-algoritmen om relationele gegevens te analyseren. Het vermogen van Tapas om specifieke elementen uit grote gegevensopslagplaatsen te extraheren, zou zich ook kunnen lenen voor het verbeteren van de responsmogelijkheden.

Underhood, Tapas maakt gebruik van een variatie op de BERT natuurlijke taalverwerkingstechniek gebruikt in zoekopdrachten uitgevoerd door de Google-engine.

BERT biedt meer precisie dan traditionele benaderingen omdat het een AI in staat stelt een tekstsequentie niet alleen van links naar rechts of van rechts naar links te evalueren zoals gebruikelijk is, maar beide tegelijkertijd doet.

De versie die Google heeft geïmplementeerd voor TAPAS stelt AI in staat om niet alleen rekening te houden met de vraag van gebruikers en de gegevens die ze willen opvragen, maar ook met de structuur van de relationele tabellen waarin de gegevens zijn opgeslagen.

Hoe installeer ik TAPAS op Linux?

Aangezien TAPAS is in wezen een BERT-model en stelt daarom dezelfde eisen. Dit betekent dat een groot model kan worden getraind met een sequentielengte van 512 waarvoor een TPU nodig is.

Om TAPAS op Linux te kunnen installeren we hebben de protocolcompiler nodig, die te vinden is in de meeste Linux-distributies.

In Debian, Ubuntu en afgeleiden hiervan kunnen we de compiler installeren met het volgende commando:

sudo apt-get install protobuf-compiler

In het geval van Arch Linux, Manjaro, Arco Linux of een andere afgeleide van Arch Linux, installeren we met:

sudo pacman -S protobuf

Om TAPAS te kunnen installeren, hoeven we alleen de broncode op te halen en te compileren met de volgende commando's:

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

En om de testsuite uit te voeren, gebruiken we de tox-bibliotheek die kan worden uitgevoerd door te bellen naar:

pip install tox
tox

Vanaf hier zal de AI getraind moeten worden in het interessegebied. Hoewel sommige getrainde modellen worden aangeboden in de GitHub-repository.

Daarnaast kunt u verschillende configuratie-opties gebruiken, zoals de optie max_seq_lengte om kortere reeksen te maken. Dit vermindert de nauwkeurigheid, maar maakt het model GPU ook trainbaar. Een andere optie is om de batchgrootte te verkleinen (trein_batch_grootte), maar dit heeft waarschijnlijk ook invloed op de nauwkeurigheid.

Eindelijk als je er meer over wilt weten Over deze AI kunt u de details van het gebruik, de uitvoering en andere informatie bekijken In de volgende link.


Laat je reactie achter

Uw e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *

*

*

  1. Verantwoordelijk voor de gegevens: Miguel Ángel Gatón
  2. Doel van de gegevens: Controle SPAM, commentaarbeheer.
  3. Legitimatie: uw toestemming
  4. Mededeling van de gegevens: De gegevens worden niet aan derden meegedeeld, behalve op grond van wettelijke verplichting.
  5. Gegevensopslag: database gehost door Occentus Networks (EU)
  6. Rechten: u kunt uw gegevens op elk moment beperken, herstellen en verwijderen.