Google пусна изходния код на своя AI "TAPAS"

Google обяви пускането на изходния код на "TAPAS" (Разбиране на таблицата), невронна мрежа (изкуствен интелект) разработен вътрешно, за да отговори на въпрос на естествен език и вземете отговора от релационна база данни или електронна таблица.

За да се получат оптимални резултати в TAPAS, разработчиците, отговарящи за проекта, се посветиха на обучението на невронната мрежа с 6.2 милиона двойки таблица към текст, взет от Уикипедия. За да провери, невронната мрежа трябваше да възстанови липсващите думи както в таблиците, така и в текстовете, в които не е била обучена. Точността на възстановяване е 71,4% тъй като бенчмарк тест показа, че невронната мрежа предоставя точни или сравними отговори, отколкото конкурентните алгоритми и в трите набора от данни.

Относно TAPAS

в основата си фокусът на този проект е да може да се консултира, обработва и показва информация свързани с условията на заявката, направена от потребителя на естествен език, улесняваща в голям мащаб получаването на информация.

Основен пример за използването на TAPAS е, ако потребителят иска да оцени данните за продажбите, приходите, искания, наред с други неща. Освен това трябва да вземете предвид това TAPAS не само се ограничава до получаване на информация от база данни, но също така е в състояние да извършва изчисления, алгоритъмът търси отговора в клетките на таблицата, както директно, така и чрез добавяне, усредняване и други оператори, в допълнение към това той може също така да търси отговора между няколко таблици едновременно.

Google казва, че тапасът превъзхожда или отговаря на трите най-добри алгоритми с отворен код за анализ на релационни данни. Способността на Tapas да извлича специфични елементи от големи хранилища за данни също може да се поддаде на подобряване на възможностите за реакция.

Underhood, Tapas използва вариант на техниката за обработка на естествен език BERT използвани при търсения, извършвани от двигателя на Google.

BERT осигурява по-голяма точност от традиционните подходи тъй като позволява на AI да оценява текстова последователност не само отляво надясно или отдясно наляво, както е обичайната практика, но прави и двете едновременно.

Версията, която Google внедри за TAPAS, позволява на AI да разглежда не само въпроса, зададен от потребителите, и данните, които искат да запитват, но и структурата на релационните таблици, в които се съхраняват данните.

Как да инсталирам TAPAS на Linux?

имайки предвид, че TAPAS по същество е модел BERT и следователно има същите изисквания. Това означава, че голям модел може да бъде обучен с дължина на последователността 512, което ще изисква TPU.

За да можете да инсталирате TAPAS на Linux ние се нуждаем от компилатора на протоколи, които могат да бъдат намерени в повечето дистрибуции на Linux.

В Debian, Ubuntu и производните от тях можем да инсталираме компилатора със следната команда:

sudo apt-get install protobuf-compiler

В случай на Arch Linux, Manjaro, Arco Linux или друго производно на Arch Linux, ние инсталираме с:

sudo pacman -S protobuf

Сега, за да можем да инсталираме TAPAS, трябва само да получим изходния код и да извършим компилацията със следните команди:

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

И за да стартираме тестовия пакет, използваме токси библиотеката, която може да се стартира чрез извикване:

pip install tox
tox

Оттук ИИ ще трябва да бъде обучен в интересуващата област. Все пак някои обучени модели се предлагат в хранилището на GitHub.

Освен това можете да използвате различни опции за конфигуриране, като опцията max_seq_length за създаване на по-къси последователности. Това ще намали точността, но също така ще направи модела GPU-обучим. Друга възможност е да намалите размера на партидата (train_batch_size), но това вероятно ще повлияе и на точността.

И накрая, ако искате да научите повече за това За този AI можете да проверите подробностите за използването, изпълнението и друга информация В следващия линк.


Оставете вашия коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

*

*

  1. Отговорен за данните: Мигел Анхел Гатон
  2. Предназначение на данните: Контрол на СПАМ, управление на коментари.
  3. Легитимация: Вашето съгласие
  4. Съобщаване на данните: Данните няма да бъдат съобщени на трети страни, освен по законово задължение.
  5. Съхранение на данни: База данни, хоствана от Occentus Networks (ЕС)
  6. Права: По всяко време можете да ограничите, възстановите и изтриете информацията си.