구글은 자사 AI "TAPAS"의 소스 코드를 공개했다

구글은 "TAPAS"의 소스 코드의 공개를 발표했습니다 (테이블 파싱), 신경망 (인공 지능) 자연어로 된 질문에 답하기 위해 내부적으로 개발 관계형 데이터베이스 또는 스프레드 시트에서 답을 얻을 수 있습니다.

TAPAS에서 최적의 결과를 얻기 위해 프로젝트를 담당하는 개발자는 6.2 만 쌍으로 신경망 훈련에 전념했습니다. 위키 백과에서 가져온 텍스트에 대한 표. 이를 확인하기 위해 신경망은 학습되지 않은 표와 텍스트 모두에서 누락 된 단어를 복원해야했습니다. 회복 정밀도는 71,4 %였습니다. 벤치 마크 테스트에 따르면 신경망은 세 데이터 세트 모두에서 경쟁 알고리즘보다 정확하거나 비슷한 답변을 제공합니다.

TAPAS 정보

기본적으로 이 프로젝트의 초점은 정보를 상담, 처리 및 표시 할 수있는 것입니다. 사용자가 자연어로 만든 쿼리 조건과 관련하여 대규모 정보 획득을 용이하게합니다.

TAPAS 사용의 기본 예는 사용자가 판매 데이터, 수입, 무엇보다도 요청. 그 외에도 고려해야 할 사항 TAPAS는 데이터베이스에서 정보를 얻는 데 국한 될뿐만 아니라 계산을 수행 할 수도 있습니다., 알고리즘은 테이블의 셀에서 직접 및 덧셈, 평균 및 기타 연산자를 통해 답변을 찾습니다. 또한 동시에 여러 테이블 간의 답변을 찾을 수도 있습니다.

구글, 타파스가 상위 XNUMX 개 오픈 소스 알고리즘을 능가하거나 일치한다고 말한다 관계형 데이터를 분석합니다. 대규모 데이터 저장소에서 특정 항목을 추출하는 Tapas의 기능은 응답 기능을 개선하는 데 도움이 될 수 있습니다.

언더 후드, 타파스는 BERT 자연어 처리 기술의 변형을 사용합니다. Google 엔진에서 수행하는 검색에 사용됩니다.

BERT는 기존 접근 방식보다 더 높은 정밀도를 제공합니다. AI가 일반적인 관행처럼 텍스트 시퀀스를 왼쪽에서 오른쪽으로 또는 오른쪽에서 왼쪽으로 평가할 수있을뿐만 아니라 동시에 두 가지 작업을 수행 할 수 있기 때문입니다.

구글이 TAPAS를 위해 구현 한 버전을 통해 AI는 사용자가 제기 한 질문과 쿼리하려는 데이터뿐만 아니라 데이터가 저장되는 관계형 테이블의 구조도 고려할 수 있습니다.

Linux에 TAPAS를 설치하는 방법은 무엇입니까?

점을 감안할 때 TAPAS는 본질적으로 BERT 모델이므로 동일한 요구 사항이 있습니다.. 즉, TPU가 필요한 512의 시퀀스 길이로 큰 모델을 학습시킬 수 있습니다.

Linux에 TAPAS를 설치할 수 있으려면 프로토콜 컴파일러가 필요합니다. 대부분의 Linux 배포판에서 찾을 수 있습니다.

Debian, Ubuntu 및 이들의 파생물에서 다음 명령을 사용하여 컴파일러를 설치할 수 있습니다.

sudo apt-get install protobuf-compiler

Arch Linux, Manjaro, Arco Linux 또는 기타 Arch Linux 파생물의 경우 다음과 함께 설치됩니다.

sudo pacman -S protobuf

이제 TAPAS를 설치하려면 소스 코드를 얻고 다음 명령으로 컴파일하면됩니다.

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

그리고 테스트 스위트를 실행하기 위해 다음을 호출하여 실행할 수있는 tox 라이브러리를 사용합니다.

pip install tox
tox

여기에서 AI는 관심 분야에서 훈련을 받아야합니다. 그러나 일부 훈련 된 모델은 GitHub 저장소에서 제공됩니다.

또한 옵션과 같은 다른 구성 옵션을 사용할 수 있습니다. 최대_순서_길이 더 짧은 시퀀스를 만듭니다. 이렇게하면 정확도가 떨어지지 만 모델을 GPU 학습 가능하게 만듭니다. 또 다른 옵션은 배치 크기 (기차_배치_크기),하지만 이는 정확도에도 영향을 미칠 수 있습니다.

마지막으로 그것에 대해 더 알고 싶다면 이 AI에 대해 사용, 실행 및 기타 정보에 대한 세부 정보를 확인할 수 있습니다 다음 링크에서.


코멘트를 남겨주세요

귀하의 이메일 주소는 공개되지 않습니다. 필수 필드가 표시되어 있습니다 *

*

*

  1. 데이터 책임자 : Miguel Ángel Gatón
  2. 데이터의 목적 : 스팸 제어, 댓글 관리.
  3. 합법성 : 귀하의 동의
  4. 데이터 전달 : 법적 의무에 의한 경우를 제외하고 데이터는 제 XNUMX 자에게 전달되지 않습니다.
  5. 데이터 저장소 : Occentus Networks (EU)에서 호스팅하는 데이터베이스
  6. 권리 : 귀하는 언제든지 귀하의 정보를 제한, 복구 및 삭제할 수 있습니다.