谷歌發布AI“TAPAS”原始碼

Google宣布發布“ TAPAS”的源代碼 （表查詢）， 神經網絡 （人工智能） 內部開發以便用自然語言回答問題 並從關係數據庫或電子表格中獲取答案。

為了在TAPAS中獲得最佳結果， 該項目的開發人員致力於訓練6.2萬對神經網絡 從表格到維基百科的文字。為了驗證，神經網絡必須在表格和未經訓練的文本中恢復丟失的單詞。 回收精度為71,4％ 基準測試表明，在所有三個數據集中，神經網絡都比競爭對手的算法提供準確或可比的響應。

關於TAPAS

基本上 該項目的重點是能夠查詢，處理和顯示信息 與用戶以自然語言進行的查詢的術語有關，從而極大地促進了信息的獲取。

使用TAPAS的一個基本示例是用戶是否要評估銷售數據，收入， 要求等。除此之外，您還必須考慮到 TAPAS不僅限於從數據庫獲取信息，而且還能夠執行計算，該算法不僅可以直接在表單元格中查找答案，還可以通過加法，求平均值和其他運算符查找答案，此外，它還可以同時在多個表之間查找答案。

谷歌表示Tapas優於或匹配前三種開源算法 分析關係數據。 Tapas從大型數據存儲庫中提取特定項目的能力還有助於提高響應能力。

引擎蓋下 Tapas採用了BERT自然語言處理技術的一種變體 用於Google引擎進行的搜索。

BERT比傳統方法提供更高的精度 因為它使AI不僅可以像通常那樣從左到右或從右到左評估文本序列，而且可以同時執行這兩個操作。

Google為TAPAS實現的版本使AI不僅可以考慮用戶提出的問題和他們想要查詢的數據，還可以考慮存儲數據的關係表的結構。

考慮到 TAPAS本質上是BERT模型，因此具有相同的要求。這意味著可以訓練序列長度為512的大型模型，這將需要TPU。

能夠在Linux上安裝TAPAS 我們需要協議編譯器 可以在大多數Linux發行版中找到。

在Debian，Ubuntu及其衍生產品中，我們可以使用以下命令安裝編譯器：

sudo apt-get install protobuf-compiler

對於Arch Linux，Manjaro，Arco Linux或其他任何Arch Linux派生版本，我們安裝：

sudo pacman -S protobuf

現在，為了安裝TAPAS，我們只需要獲取源代碼並使用以下命令進行編譯：

git clone https://github.com/google-research/tapas cd tapas pip install -e .

為了運行測試套件，我們使用可以通過以下方式運行的tox庫：

pip install tox tox

從這裡開始，必須在感興趣的領域對AI進行培訓。雖然 GitHub存儲庫中提供了一些訓練有素的模型。

此外，您可以使用其他配置選項，例如 最大序列長度 創建較短的序列。這將降低準確性，但也會使模型GPU易於訓練。另一種選擇是減小批量大小（訓練批次大小），但這也可能會影響準確性。

最後，如果您想了解更多 關於此AI，您可以檢查使用，執行和其他信息的詳細信息在下面的鏈接中。