Google發布了其AI“ TAPAS”的源代碼

Google宣布發布“ TAPAS”的源代碼 (表查詢), 神經網絡 (人工智能) 內部開發以便用自然語言回答問題 並從關係數據庫或電子表格中獲取答案。

為了在TAPAS中獲得最佳結果, 該項目的開發人員致力於訓練6.2萬對神經網絡 從表格到維基百科的文字。 為了驗證,神經網絡必須在表格和未經訓練的文本中恢復丟失的單詞。 回收精度為71,4% 基準測試表明,在所有三個數據集中,神經網絡都比競爭對手的算法提供準確或可比的響應。

關於TAPAS

基本上 該項目的重點是能夠查詢,處理和顯示信息 與用戶以自然語言進行的查詢的術語有關,從而極大地促進了信息的獲取。

使用TAPAS的一個基本示例是用戶是否要評估銷售數據,收入, 要求等。 除此之外,您還必須考慮到 TAPAS不僅限於從數據庫獲取信息,而且還能夠執行計算,該算法不僅可以直接在表單元格中查找答案,還可以通過加法,求平均值和其他運算符查找答案,此外,它還可以同時在多個表之間查找答案。

谷歌表示Tapas優於或匹配前三種開源算法 分析關係數據。 Tapas從大型數據存儲庫中提取特定項目的能力還有助於提高響應能力。

引擎蓋下 Tapas採用了BERT自然語言處理技術的一種變體 用於Google引擎進行的搜索。

BERT比傳統方法提供更高的精度 因為它使AI不僅可以像通常那樣從左到右或從右到左評估文本序列,而且可以同時執行這兩個操作。

Google為TAPAS實現的版本使AI不僅可以考慮用戶提出的問題和他們想要查詢的數據,還可以考慮存儲數據的關係表的結構。

如何在Linux上安裝TAPAS?

考慮到 TAPAS本質上是BERT模型,因此具有相同的要求。 這意味著可以訓練序列長度為512的大型模型,這將需要TPU。

能夠在Linux上安裝TAPAS 我們需要協議編譯器 可以在大多數Linux發行版中找到。

在Debian,Ubuntu及其衍生產品中,我們可以使用以下命令安裝編譯器:

sudo apt-get install protobuf-compiler

對於Arch Linux,Manjaro,Arco Linux或其他任何Arch Linux派生版本,我們安裝:

sudo pacman -S protobuf

現在,為了安裝TAPAS,我們只需要獲取源代碼並使用以下命令進行編譯:

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

為了運行測試套件,我們使用可以通過以下方式運行的tox庫:

pip install tox
tox

從這裡開始,必須在感興趣的領域對AI進行培訓。 雖然 GitHub存儲庫中提供了一些訓練有素的模型。

此外,您可以使用其他配置選項,例如 最大序列長度 創建較短的序列。 這將降低準確性,但也會使模型GPU易於訓練。 另一種選擇是減小批量大小(訓練批次大小),但這也可能會影響準確性。

最後,如果您想了解更多 關於此AI,您可以檢查使用,執行和其他信息的詳細信息 在下面的鏈接中。


發表您的評論

您的電子郵件地址將不會被發表。 必填字段標有 *

*

*

  1. 負責數據:MiguelÁngelGatón
  2. 數據用途:控制垃圾郵件,註釋管理。
  3. 合法性:您的同意
  4. 數據通訊:除非有法律義務,否則不會將數據傳達給第三方。
  5. 數據存儲:Occentus Networks(EU)託管的數據庫
  6. 權利:您可以隨時限制,恢復和刪除您的信息。