Google опубликовал исходный код своего ИИ «ТАПАС».

 

Google объявила о выпуске исходного кода «ТАПАС» (ТАБЛИЦА ПАРАМЕТРОВ), нейронная сеть (искусственный интеллект) разработан внутри компании, чтобы ответить на вопрос на естественном языке и получите ответ из реляционной базы данных или электронной таблицы.

Для получения оптимальных результатов в ТАПАС, разработчики, ответственные за проект, посвятили себя обучению нейронной сети с 6.2 миллионами пар таблица в текст взят из Википедии. Для проверки нейросети пришлось восстанавливать пропущенные слова как в таблицах, так и в текстах, в которых она не обучалась. Точность восстановления составила 71,4%. как эталонный тест показал, что нейронная сеть обеспечивает точные или сопоставимые ответы, чем конкурирующие алгоритмы во всех трех наборах данных.

О ТАПАС

в основном В центре внимания этого проекта - возможность консультироваться, обрабатывать и отображать информацию связаны с условиями запроса, сделанного пользователем на естественном языке, что облегчает получение информации в больших масштабах.

Базовый пример использования TAPAS - если пользователь хочет оценить данные о продажах, доходах, запросы, среди прочего. Кроме того, необходимо учитывать, что TAPAS не ограничивается только получением информации из базы данных, но также может выполнять вычисления., алгоритм ищет ответ в ячейках таблиц, как напрямую, так и с помощью операций сложения, усреднения и других операторов, кроме того, он может также искать ответ между несколькими таблицами одновременно.

Google утверждает, что Tapas превосходит или соответствует трем лучшим алгоритмам с открытым исходным кодом для анализа реляционных данных. Способность Tapas извлекать определенные элементы из больших репозиториев данных также может улучшить возможности реагирования.

Под капотом, Tapas использует вариант метода обработки естественного языка BERT. используется в поиске, выполняемом системой Google.

BERT обеспечивает большую точность, чем традиционные подходы потому что это позволяет ИИ оценивать последовательность текста не только слева направо или справа налево, как это обычно делается, но и то и другое одновременно.

Версия, реализованная Google для TAPAS, позволяет ИИ учитывать не только вопросы, поставленные пользователями, и данные, которые они хотят запрашивать, но и структуру реляционных таблиц, в которых хранятся данные.

Как установить ТАПАС на Linux?

При условии TAPAS по сути является моделью BERT и, следовательно, имеет те же требования.. Это означает, что большую модель можно обучить с длиной последовательности 512, что потребует TPU.

Чтобы иметь возможность установить ТАПАС в Linux нам нужен компилятор протокола, который можно найти в большинстве дистрибутивов Linux.

В Debian, Ubuntu и их производных мы можем установить компилятор с помощью следующей команды:

sudo apt-get install protobuf-compiler

В случае Arch Linux, Manjaro, Arco Linux или любой другой производной от Arch Linux мы устанавливаем с помощью:

sudo pacman -S protobuf

Теперь, чтобы иметь возможность установить TAPAS, нам нужно только получить исходный код и выполнить компиляцию с помощью следующих команд:

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

А для запуска набора тестов мы используем библиотеку tox, которую можно запустить, вызвав:

pip install tox
tox

Отсюда ИИ должен быть обучен в интересующей области. Хотя некоторые обученные модели предлагаются в репозитории GitHub.

Кроме того, вы можете использовать различные параметры конфигурации, например, параметр max_seq_length для создания более коротких последовательностей. Это снизит точность, но также сделает модель GPU обучаемой. Другой вариант - уменьшить размер партии (train_batch_size), но это, вероятно, также повлияет на точность.

Наконец, если вы хотите узнать об этом больше Об этом ИИ вы можете проверить детали использования, выполнения и другую информацию. По следующей ссылке.


Содержание статьи соответствует нашим принципам редакционная этика. Чтобы сообщить об ошибке, нажмите здесь.

Будьте первым, чтобы комментировать

Оставьте свой комментарий

Ваш электронный адрес не будет опубликован. Обязательные для заполнения поля помечены *

*

*

  1. Ответственный за данные: Мигель Анхель Гатон
  2. Назначение данных: контроль спама, управление комментариями.
  3. Легитимация: ваше согласие
  4. Передача данных: данные не будут переданы третьим лицам, кроме как по закону.
  5. Хранение данных: база данных, размещенная в Occentus Networks (ЕС)
  6. Права: в любое время вы можете ограничить, восстановить и удалить свою информацию.