GoogleはAI「TAPAS」のソースコードをリリースしました

グーグルは「タパス」のソースコードのリリースを発表しました (テーブル構文解析)、 ニューラルネットワーク (人工知能) 自然言語で質問に答えるために社内で開発されました リレーショナルデータベースまたはスプレッドシートから答えを取得します。

TAPASで最適な結果を得るために、 プロジェクトを担当する開発者は、6.2万ペアのニューラルネットワークのトレーニングに専念しました ウィキペディアから取られたテキストへの表。 検証するために、ニューラルネットワークは、テーブルとトレーニングされていないテキストの両方で欠落している単語を復元する必要がありました。 回収率は71,4%でした ベンチマークテストとして、ニューラルネットワークはXNUMXつのデータセットすべてでライバルアルゴリズムよりも正確または同等の答えを提供することが示されました。

タパスについて

基本的に このプロジェクトの焦点は、情報を参照、処理、表示できるようにすることです。 ユーザーが自然言語で行うクエリの用語に関連し、情報の取得を大規模に促進します。

TAPASの使用の基本的な例は、ユーザーが売上データ、収入、 とりわけ、リクエスト。 それに加えて、あなたはそれを考慮に入れなければなりません TAPASは、データベースから情報を取得するだけでなく、計算を実行することもできます。、アルゴリズムは、直接および加算、平均化、その他の演算子を使用して、テーブルセル内の回答を検索します。さらに、複数のテーブル間で同時に回答を検索することもできます。

グーグルはタパスがトップXNUMXのオープンソースアルゴリズムよりも優れているか一致していると言います リレーショナルデータを分析します。 大規模なデータリポジトリから特定の要素を抽出するTapasの機能は、応答機能の向上にも役立つ可能性があります。

アンダーフード、 タパスは、BERT自然言語処理技術のバリエーションを採用しています Googleエンジンによって実行される検索で使用されます。

BERTは、従来のアプローチよりも高い精度を提供します これは、AIがテキストシーケンスを通常の方法のように左から右または右から左に評価できるだけでなく、両方を同時に評価できるためです。

GoogleがTAPASに実装したバージョンでは、AIは、ユーザーが提起した質問とクエリしたいデータだけでなく、データが格納されているリレーショナルテーブルの構造も考慮することができます。

LinuxにTAPASをインストールするにはどうすればいいですか?

ことを考えると TAPASは本質的にBERTモデルであるため、同じ要件があります。 これは、TPUを必要とする512のシーケンス長で大きなモデルをトレーニングできることを意味します。

LinuxにTAPASをインストールできるようにするには プロトコルコンパイラが必要です。 これはほとんどのLinuxディストリビューションにあります。

Debian、Ubuntu、およびこれらの派生物では、次のコマンドを使用してコンパイラをインストールできます。

sudo apt-get install protobuf-compiler

Arch Linux、Manjaro、Arco Linux、またはArch Linuxの他の派生物の場合、次のものを使用してインストールします。

sudo pacman -S protobuf

これでTAPASをインストールできるようになり、ソースコードを取得して、次のコマンドでコンパイルするだけで済みます。

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

また、テストスイートを実行するには、次の呼び出しで実行できるtoxライブラリを使用します。

pip install tox
tox

ここから、AIは関心のある分野でトレーニングを受ける必要があります。 でも トレーニング済みのモデルの一部は、GitHubリポジトリで提供されています。

さらに、オプションなどのさまざまな構成オプションを使用できます max_seq_length より短いシーケンスを作成します。 これにより精度が低下しますが、モデルがGPUでトレーニング可能になります。 別のオプションは、バッチサイズを減らすことです(train_batch_size)が、これは精度にも影響を与える可能性があります。

最後に、それについてもっと知りたい場合 このAIについては、使用状況や実行状況などの詳細を確認できます。 次のリンクで。


コメントを残す

あなたのメールアドレスが公開されることはありません。 必須フィールドには付いています *

*

*

  1. データの責任者:MiguelÁngelGatón
  2. データの目的:SPAMの制御、コメント管理。
  3. 正当化:あなたの同意
  4. データの伝達:法的義務がある場合を除き、データが第三者に伝達されることはありません。
  5. データストレージ:Occentus Networks(EU)がホストするデータベース
  6. 権利:いつでも情報を制限、回復、削除できます。