Google släppte källkoden för sin AI "TAPAS"

Google tillkännagav släppandet av källkoden för "TAPAS" (TABELLERING), ett neuralt nätverk (artificiell intelligens) utvecklas internt för att svara på en fråga på naturligt språk och få svaret från en relationsdatabas eller ett kalkylark.

För att uppnå optimala resultat i TAPAS, utvecklarna som ansvarade för projektet ägnade sig åt att utbilda neuronnätverket med 6.2 miljoner par tabell till text hämtad från Wikipedia. För att verifiera var det neurala nätverket tvungen att återställa de saknade orden både i tabellerna och i texterna där det inte hade tränats. Återvinningsprecisionen var 71,4% som ett riktmärketest visade att det neurala nätverket ger korrekta eller jämförbara svar än konkurrerande algoritmer i alla tre datamängderna.

Om TAPAS

i grund och botten fokus för detta projekt är att kunna konsultera, bearbeta och visa information relaterade till villkoren i frågan som användaren gjort på naturligt språk, vilket i stor skala underlättar inhämtningen av information.

Ett grundläggande exempel på användningen av TAPAS är om en användare vill utvärdera försäljningsdata, inkomst, begär bland annat. Dessutom måste du ta hänsyn till det TAPAS är inte bara begränsat till att erhålla information från en databas, utan kan också utföra beräkningar, letar algoritmen efter svaret i tabellcellerna, både direkt och med hjälp av addition, medelvärde och andra operatorer, förutom att det också kan leta efter svaret mellan flera tabeller samtidigt.

Google säger att Tapas överträffar eller matchar de tre bästa källkodsalgoritmerna för att analysera relationsdata. Tapas förmåga att extrahera specifika element från stora datalagrar kan också lämna sig för att förbättra svarsfunktionerna.

Under motorhuven, Tapas använder en variation av BERT-tekniken för naturlig språkbehandling används i sökningar utförda av Google-motorn.

BERT ger större precision än traditionella metoder eftersom det tillåter en AI att utvärdera en textsekvens inte bara från vänster till höger eller höger till vänster som vanligt, utan gör båda samtidigt.

Den version som Google implementerade för TAPAS tillåter AI att inte bara överväga frågan som ställs av användarna och de data de vill fråga, utan också strukturen för relationstabellerna där data lagras.

Hur installerar jag TAPAS på Linux?

Med tanke på att TAPAS är i huvudsak en BERT-modell och har därför samma krav. Detta innebär att en stor modell kan tränas med en sekvenslängd på 512 som kräver en TPU.

För att kunna installera TAPAS på Linux vi kräver protokollkompilatorn, som finns i de flesta Linux-distributioner.

I Debian, Ubuntu och derivat av dessa kan vi installera kompilatorn med följande kommando:

sudo apt-get install protobuf-compiler

När det gäller Arch Linux, Manjaro, Arco Linux eller andra derivat av Arch Linux installerar vi med:

sudo pacman -S protobuf

För att kunna installera TAPAS behöver vi bara hämta källkoden och utföra kompileringen med följande kommandon:

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

Och för att köra testpaketet använder vi tox-biblioteket som kan köras genom att ringa:

pip install tox
tox

Härifrån måste AI utbildas inom intresseområdet. Fastän Vissa utbildade modeller erbjuds i GitHub-förvaret.

Dessutom kan du använda olika konfigurationsalternativ, till exempel alternativet max_seq_length för att skapa kortare sekvenser. Detta minskar noggrannheten men kommer också att göra GPU-modellen tränbar. Ett annat alternativ är att minska batchstorleken (train_batch_size), men detta kommer sannolikt också att påverka noggrannheten.

Slutligen om du vill veta mer om det Om denna AI kan du kontrollera information om användning, utförande och annan information I följande länk.


Lämna din kommentar

Din e-postadress kommer inte att publiceras. Obligatoriska fält är markerade med *

*

*

  1. Ansvarig för uppgifterna: Miguel Ángel Gatón
  2. Syftet med uppgifterna: Kontrollera skräppost, kommentarhantering.
  3. Legitimering: Ditt samtycke
  4. Kommunikation av uppgifterna: Uppgifterna kommer inte att kommuniceras till tredje part förutom enligt laglig skyldighet.
  5. Datalagring: databas värd för Occentus Networks (EU)
  6. Rättigheter: När som helst kan du begränsa, återställa och radera din information.