Google hat den Quellcode seiner KI "TAPAS" veröffentlicht.

Google kündigte die Veröffentlichung des Quellcodes von "TAPAS" an. (TABELLE PARSEN), ein neuronales Netzwerk (künstliche Intelligenz) intern entwickelt, um eine Frage in natürlicher Sprache zu beantworten und erhalten Sie die Antwort aus einer relationalen Datenbank oder Tabelle.

Um optimale Ergebnisse in TAPAS zu erzielen, Die für das Projekt verantwortlichen Entwickler widmeten sich dem Training des neuronalen Netzwerks mit 6.2 Millionen Paaren Tabelle zu Text aus Wikipedia. Um dies zu überprüfen, musste das neuronale Netzwerk die fehlenden Wörter sowohl in den Tabellen als auch in den Texten wiederherstellen, in denen es nicht trainiert worden war. Die Wiederherstellungsgenauigkeit betrug 71,4% Ein Benchmark-Test hat gezeigt, dass das neuronale Netzwerk in allen drei Datensätzen genaue oder vergleichbare Antworten liefert als konkurrierende Algorithmen.

Über TAPAS

Im Grunde Der Schwerpunkt dieses Projekts liegt darauf, Informationen abrufen, verarbeiten und anzeigen zu können im Zusammenhang mit den Bedingungen der vom Benutzer in natürlicher Sprache gestellten Abfrage, die in großem Umfang das Erhalten von Informationen erleichtert.

Ein grundlegendes Beispiel für die Verwendung von TAPAS ist, wenn ein Benutzer Verkaufsdaten, Einkommen, Anfragen unter anderem. Außerdem muss man das berücksichtigen TAPAS beschränkt sich nicht nur auf das Abrufen von Informationen aus einer Datenbank, sondern kann auch Berechnungen durchführenDer Algorithmus sucht die Antwort in den Tabellenzellen sowohl direkt als auch mittels Addition, Mittelwertbildung und anderen Operatoren. Außerdem kann er die Antwort zwischen mehreren Tabellen gleichzeitig suchen.

Google sagt, dass Tapas die drei besten Open Source-Algorithmen übertrifft oder übertrifft relationale Daten zu analysieren. Die Fähigkeit von Tapas, bestimmte Elemente aus großen Datenrepositorys zu extrahieren, könnte sich auch zur Verbesserung der Antwortmöglichkeiten eignen.

Underhood, Tapas verwendet eine Variation der BERT-Verarbeitungstechnik für natürliche Sprachen Wird bei Suchvorgängen verwendet, die von der Google-Engine ausgeführt werden.

BERT bietet eine höhere Präzision als herkömmliche Ansätze weil es einer KI ermöglicht, eine Textsequenz nicht nur von links nach rechts oder von rechts nach links auszuwerten, wie es üblich ist, sondern beides gleichzeitig.

Mit der von Google für TAPAS implementierten Version kann AI nicht nur die von den Nutzern gestellten Fragen und die Daten, die sie abfragen möchten, berücksichtigen, sondern auch die Struktur der relationalen Tabellen, in denen die Daten gespeichert sind.

Wie installiere ich TAPAS unter Linux?

Da TAPAS ist im Wesentlichen ein BERT-Modell und hat daher die gleichen Anforderungen. Dies bedeutet, dass ein großes Modell mit einer Sequenzlänge von 512 trainiert werden kann, für die eine TPU erforderlich ist.

Um TAPAS unter Linux installieren zu können wir benötigen den Protokoll-Compiler, Dies ist in den meisten Linux-Distributionen zu finden.

In Debian, Ubuntu und Ableitungen davon können wir den Compiler mit dem folgenden Befehl installieren:

sudo apt-get install protobuf-compiler

Im Fall von Arch Linux, Manjaro, Arco Linux oder einem anderen Derivat von Arch Linux installieren wir mit:

sudo pacman -S protobuf

Um TAPAS installieren zu können, müssen wir nur noch den Quellcode abrufen und die Kompilierung mit den folgenden Befehlen durchführen:

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

Und um die Testsuite auszuführen, verwenden wir die Tox-Bibliothek, die ausgeführt werden kann, indem Folgendes aufgerufen wird:

pip install tox
tox

Von hier aus muss die KI in dem Bereich von Interesse geschult werden. Obwohl Einige trainierte Modelle werden im GitHub-Repository angeboten.

Darüber hinaus können Sie verschiedene Konfigurationsoptionen verwenden, z. B. die Option max_seq_länge kürzere Sequenzen zu erstellen. Dies verringert die Genauigkeit, macht das Modell aber auch GPU-trainierbar. Eine weitere Option ist die Reduzierung der Chargengröße (train_batch_size), aber dies wird wahrscheinlich auch die Genauigkeit beeinträchtigen.

Zum Schluss, wenn Sie mehr darüber wissen möchten Über diese KI können Sie die Details der Verwendung, Ausführung und anderer Informationen überprüfen im folgenden Link.


Hinterlasse einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert mit *

*

*

  1. Verantwortlich für die Daten: Miguel Ángel Gatón
  2. Zweck der Daten: Kontrolle von SPAM, Kommentarverwaltung.
  3. Legitimation: Ihre Zustimmung
  4. Übermittlung der Daten: Die Daten werden nur durch gesetzliche Verpflichtung an Dritte weitergegeben.
  5. Datenspeicherung: Von Occentus Networks (EU) gehostete Datenbank
  6. Rechte: Sie können Ihre Informationen jederzeit einschränken, wiederherstellen und löschen.