Google mengeluarkan kod sumber AI "TAPAS"

Google mengumumkan pelepasan kod sumber "TAPAS" (ParSing Jadual), rangkaian saraf (kecerdasan buatan) dikembangkan secara dalaman untuk menjawab soalan dalam bahasa semula jadi dan dapatkan jawapannya dari pangkalan data atau hamparan hubungan.

Untuk mendapatkan hasil yang optimum dalam TAPAS, pemaju yang bertanggungjawab dalam projek ini mengabdikan diri untuk melatih rangkaian saraf dengan 6.2 juta pasang jadual ke teks yang diambil dari Wikipedia. Untuk mengesahkan, rangkaian saraf harus memulihkan kata-kata yang hilang baik dalam jadual dan teks yang belum dilatihnya. Ketepatan pemulihan adalah 71,4% sebagai ujian penanda aras menunjukkan bahawa rangkaian saraf memberikan jawapan yang tepat atau setanding daripada algoritma saingan dalam ketiga-tiga set data.

Mengenai TAPAS

Pada asasnya fokus projek ini adalah untuk dapat berunding, memproses dan memaparkan maklumat berkaitan dengan syarat-syarat pertanyaan yang dibuat oleh pengguna dalam bahasa semula jadi, yang memudahkan dalam memperoleh maklumat secara besar-besaran.

Contoh asas penggunaan TAPAS adalah jika pengguna ingin menilai data penjualan, pendapatan, permintaan, antara lain. Selain itu anda harus mengambil kira perkara itu TAPAS tidak hanya terbatas pada memperoleh maklumat dari pangkalan data, tetapi juga mampu melakukan pengiraan, algoritma mencari jawapan dalam sel jadual, baik secara langsung maupun dengan cara penambahan, rata-rata dan operator lain, selain itu ia juga dapat mencari jawapan di antara beberapa jadual pada masa yang sama.

Google Mengatakan Tapas Mengungguli atau Memadankan Tiga Algoritma Sumber Terbuka Teratas untuk menganalisis data hubungan. Keupayaan Tapas untuk mengekstrak item tertentu dari repositori data besar juga dapat meningkatkan kemampuan respons.

Di bawah umur, Tapas menggunakan variasi teknik pemprosesan bahasa semula jadi BERT digunakan dalam carian yang dilakukan oleh mesin Google.

BERT memberikan ketepatan yang lebih besar daripada pendekatan tradisional kerana membolehkan AI menilai urutan teks bukan sahaja dari kiri ke kanan atau kanan ke kiri seperti praktik biasa, tetapi melakukan keduanya pada masa yang sama.

Versi yang dilaksanakan oleh Google untuk TAPAS memungkinkan AI untuk mempertimbangkan tidak hanya pertanyaan yang diajukan oleh pengguna dan data yang ingin mereka tanyakan, tetapi juga struktur tabel hubungan di mana data tersebut disimpan.

Bagaimana cara memasang TAPAS di Linux?

Sejak itu TAPAS pada dasarnya adalah model BERT dan oleh itu mempunyai syarat yang sama. Ini bermaksud bahawa model yang besar dapat dilatih dengan panjang urutan 512 yang memerlukan TPU.

Untuk dapat memasang TAPAS di Linux kami memerlukan penyusun protokol, yang boleh didapati di sebilangan besar pengedaran Linux.

Di Debian, Ubuntu dan turunannya, kita boleh memasang pengkompil dengan arahan berikut:

sudo apt-get install protobuf-compiler

Dalam kes Arch Linux, Manjaro, Arco Linux atau turunan Arch Linux yang lain, kami memasang dengan:

sudo pacman -S protobuf

Sekarang untuk dapat memasang TAPAS, kita hanya perlu mendapatkan kod sumber dan menyusun dengan perintah berikut:

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

Dan untuk menjalankan suite ujian, kami menggunakan perpustakaan tox yang boleh dijalankan dengan memanggil:

pip install tox
tox

Dari sini AI harus dilatih dalam bidang yang diminati. Walaupun beberapa model terlatih ditawarkan di repositori GitHub.

Di samping itu, anda boleh menggunakan pilihan konfigurasi yang berbeza, seperti pilihan max_seq_length untuk membuat urutan yang lebih pendek. Ini akan mengurangkan ketepatan tetapi juga menjadikan model GPU dapat dilatih. Pilihan lain adalah untuk mengurangkan saiz kumpulan (train_batch_size), tetapi ini juga akan mempengaruhi ketepatan.

Akhirnya jika anda ingin mengetahui lebih lanjut mengenainya Mengenai AI ini, anda boleh memeriksa perincian penggunaan, pelaksanaan dan maklumat lain Dalam pautan berikut.


Tinggalkan komen anda

Alamat email anda tidak akan disiarkan. Ruangan yang diperlukan ditanda dengan *

*

*

  1. Bertanggungjawab atas data: Miguel Ángel Gatón
  2. Tujuan data: Mengendalikan SPAM, pengurusan komen.
  3. Perundangan: Persetujuan anda
  4. Komunikasi data: Data tidak akan disampaikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Pangkalan data yang dihoskan oleh Occentus Networks (EU)
  6. Hak: Pada bila-bila masa anda boleh menghadkan, memulihkan dan menghapus maklumat anda.