Google udostępnił kod źródłowy swojej sztucznej inteligencji „TAPAS”

Google ogłosił wydanie kodu źródłowego „TAPAS” (SPIS TREŚCI), sieć neuronowa (sztuczna inteligencja) opracowany wewnętrznie, aby odpowiedzieć na pytanie w języku naturalnym i uzyskaj odpowiedź z relacyjnej bazy danych lub arkusza kalkulacyjnego.

Aby uzyskać optymalne wyniki w TAPAS, Deweloperzy odpowiedzialni za projekt poświęcili się szkoleniu sieci neuronowej z 6.2 miliona par tabela do tekstu zaczerpniętego z Wikipedii. Aby to zweryfikować, sieć neuronowa musiała przywrócić brakujące słowa zarówno w tabelach, jak iw tekstach, w których nie została przeszkolona. Precyzja odzyskiwania wyniosła 71,4% jako test porównawczy wykazał, że sieć neuronowa zapewnia dokładne lub porównywalne odpowiedzi niż konkurencyjne algorytmy we wszystkich trzech zestawach danych.

O firmie TAPAS

W zasadzie celem tego projektu jest możliwość konsultowania, przetwarzania i wyświetlania informacji związane z warunkami zapytania złożonego przez użytkownika w języku naturalnym, ułatwiające na dużą skalę uzyskanie informacji.

Podstawowym przykładem wykorzystania TAPAS jest to, że użytkownik chce ocenić dane dotyczące sprzedaży, prośby, między innymi. Poza tym musisz to wziąć pod uwagę TAPAS nie ogranicza się tylko do uzyskiwania informacji z bazy danych, ale jest również zdolny do wykonywania obliczeńAlgorytm szuka odpowiedzi w komórkach tabeli, zarówno bezpośrednio, jak i poprzez dodawanie, uśrednianie i inne operatory, a ponadto może szukać odpowiedzi także między kilkoma tabelami jednocześnie.

Google twierdzi, że Tapas przewyższa lub pasuje do trzech najlepszych algorytmów Open Source analizować dane relacyjne. Zdolność Tapas do wyodrębniania określonych elementów z dużych repozytoriów danych może również przyczynić się do poprawy zdolności reagowania.

Pod maską, Tapas wykorzystuje odmianę techniki przetwarzania języka naturalnego BERT używane w wyszukiwaniach prowadzonych przez wyszukiwarkę Google.

BERT zapewnia większą precyzję niż metody tradycyjne ponieważ pozwala sztucznej inteligencji oceniać sekwencję tekstu nie tylko od lewej do prawej lub od prawej do lewej, jak to jest zwykle praktykowane, ale robi to jednocześnie.

Wersja, którą Google zaimplementowała dla TAPAS, pozwala AI brać pod uwagę nie tylko pytania zadawane przez użytkowników i dane, które chcą zapytać, ale także strukturę tabel relacyjnych, w których dane są przechowywane.

Jak zainstalować TAPAS w systemie Linux?

Ponieważ TAPAS jest zasadniczo modelem BERT i dlatego ma takie same wymagania. Oznacza to, że duży model można trenować z sekwencją o długości 512, co będzie wymagało TPU.

Aby móc zainstalować TAPAS w systemie Linux wymagamy kompilatora protokołów, które można znaleźć w większości dystrybucji Linuksa.

W Debianie, Ubuntu i ich pochodnych możemy zainstalować kompilator poleceniem:

sudo apt-get install protobuf-compiler

W przypadku Arch Linux, Manjaro, Arco Linux lub dowolnej innej pochodnej Arch Linux instalujemy z:

sudo pacman -S protobuf

Teraz, aby móc zainstalować TAPAS, musimy tylko uzyskać kod źródłowy i skompilować za pomocą następujących poleceń:

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

Do uruchomienia zestawu testów używamy biblioteki tox, którą można uruchomić wywołując:

pip install tox
tox

Stąd sztuczna inteligencja będzie musiała zostać przeszkolona w obszarze zainteresowań. Chociaż niektóre wyszkolone modele są oferowane w repozytorium GitHub.

Ponadto możesz użyć różnych opcji konfiguracyjnych, takich jak opcja maksymalna_sekwencja_długości do tworzenia krótszych sekwencji. Zmniejszy to dokładność, ale także sprawi, że model będzie można szkolić przez GPU. Inną opcją jest zmniejszenie rozmiaru partii (wielkość_wsadu_pociągu), ale prawdopodobnie wpłynie to również na dokładność.

Wreszcie, jeśli chcesz dowiedzieć się więcej na ten temat O tej sztucznej inteligencji możesz sprawdzić szczegóły użytkowania, wykonania i inne informacje W poniższym linku.


Zostaw swój komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

*

*

  1. Odpowiedzialny za dane: Miguel Ángel Gatón
  2. Cel danych: kontrola spamu, zarządzanie komentarzami.
  3. Legitymacja: Twoja zgoda
  4. Przekazywanie danych: Dane nie będą przekazywane stronom trzecim, z wyjątkiem obowiązku prawnego.
  5. Przechowywanie danych: baza danych hostowana przez Occentus Networks (UE)
  6. Prawa: w dowolnym momencie możesz ograniczyć, odzyskać i usunąć swoje dane.