Google merilis kode sumber AI "TAPAS" -nya

Google mengumumkan rilis kode sumber "TAPAS" (Tabel PArSing), jaringan saraf (kecerdasan buatan) dikembangkan secara internal untuk menjawab pertanyaan dalam bahasa alami dan dapatkan jawabannya dari database relasional atau spreadsheet.

Untuk mendapatkan hasil yang optimal di TAPAS, pengembang yang bertanggung jawab atas proyek mendedikasikan diri mereka untuk melatih jaringan saraf dengan 6.2 juta pasang dari tabel ke teks yang diambil dari Wikipedia. Untuk memverifikasi, jaringan saraf harus mengembalikan kata-kata yang hilang baik dalam tabel maupun teks yang belum pernah dilatih sebelumnya. Presisi pemulihan adalah 71,4% sebagai uji benchmark menunjukkan bahwa jaringan saraf memberikan respon yang akurat atau sebanding daripada algoritma saingan di ketiga set data.

Tentang TAPAS

Pada dasarnya fokus dari proyek ini adalah untuk dapat berkonsultasi, mengolah dan menampilkan informasi terkait dengan istilah kueri yang dibuat oleh pengguna dalam bahasa alami, memfasilitasi perolehan informasi dalam skala besar.

Contoh dasar penggunaan TAPAS adalah jika pengguna ingin mengevaluasi data penjualan, pendapatan, permintaan, antara lain. Selain itu Anda harus memperhitungkannya TAPAS tidak hanya sebatas memperoleh informasi dari database, tetapi juga mampu melakukan perhitungan, algoritma mencari jawaban pada sel tabel, baik secara langsung maupun dengan cara penjumlahan, rata-rata dan operator lainnya, selain itu juga dapat mencari jawaban antara beberapa tabel pada waktu yang bersamaan.

Google Mengatakan Tapas Mengungguli atau Mencocokkan Tiga Algoritma Sumber Terbuka Teratas untuk menganalisis data relasional. Kemampuan Tapas untuk mengekstrak elemen tertentu dari repositori data besar juga dapat meningkatkan kemampuan respon.

Underhood, Tapas menggunakan variasi teknik pemrosesan bahasa alami BERT digunakan dalam pencarian yang dilakukan oleh mesin Google.

BERT memberikan presisi yang lebih baik daripada pendekatan tradisional karena memungkinkan AI untuk mengevaluasi urutan teks tidak hanya dari kiri ke kanan atau kanan ke kiri seperti yang biasa dilakukan, tetapi melakukan keduanya pada saat yang bersamaan.

Versi yang diimplementasikan Google untuk TAPAS memungkinkan AI untuk mempertimbangkan tidak hanya pertanyaan yang diajukan oleh pengguna dan data yang ingin mereka kueri, tetapi juga struktur tabel relasional tempat data disimpan.

Bagaimana cara menginstal TAPAS di Linux?

Sejak TAPAS pada dasarnya adalah model BERT dan oleh karena itu memiliki persyaratan yang sama. Artinya, model besar dapat dilatih dengan panjang urutan 512 yang akan membutuhkan TPU.

Untuk dapat menginstal TAPAS di Linux kami membutuhkan penyusun protokol, yang dapat ditemukan di sebagian besar distribusi Linux.

Di Debian, Ubuntu dan turunannya, kita dapat menginstal kompiler dengan perintah berikut:

sudo apt-get install protobuf-compiler

Dalam kasus Arch Linux, Manjaro, Arco Linux atau turunan Arch Linux lainnya, kami menginstal dengan:

sudo pacman -S protobuf

Sekarang untuk dapat menginstal TAPAS, kita hanya perlu mendapatkan kode sumber dan mengkompilasinya dengan perintah berikut:

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

Dan untuk menjalankan rangkaian pengujian, kami menggunakan pustaka tox yang dapat dijalankan dengan memanggil:

pip install tox
tox

Dari sini AI harus dilatih di bidang yang diminati. Meskipun beberapa model terlatih ditawarkan di repositori GitHub.

Selain itu, Anda dapat menggunakan opsi konfigurasi yang berbeda, seperti opsi max_seq_length untuk membuat urutan yang lebih pendek. Ini akan mengurangi akurasi tetapi juga akan membuat model GPU dapat dilatih. Pilihan lainnya adalah mengurangi ukuran tumpukan (train_batch_size), tetapi hal ini kemungkinan besar juga akan memengaruhi akurasi.

Akhirnya jika Anda ingin tahu lebih banyak tentang itu Tentang AI ini, Anda dapat memeriksa detail penggunaan, eksekusi, dan informasi lainnya Di tautan berikut.


tinggalkan Komentar Anda

Alamat email Anda tidak akan dipublikasikan. Bidang yang harus diisi ditandai dengan *

*

*

  1. Penanggung jawab data: Miguel Ángel Gatón
  2. Tujuan data: Mengontrol SPAM, manajemen komentar.
  3. Legitimasi: Persetujuan Anda
  4. Komunikasi data: Data tidak akan dikomunikasikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Basis data dihosting oleh Occentus Networks (UE)
  6. Hak: Anda dapat membatasi, memulihkan, dan menghapus informasi Anda kapan saja.