Kanggo entuk asil sing optimal ing TAPAS, pangembang sing tanggung jawab kanggo proyek kasebut nyedhiyakake pelatihan saraf ing 6.2 yuta pasangan tabel kanggo teks sing dijupuk saka Wikipedia. Kanggo verifikasi, jaringan saraf kudu mulihake tembung sing ilang ing tabel lan teks sing durung dilatih. Presisi pamulihan 71,4% minangka tes tolok ukur nuduhake manawa jaringan saraf nyedhiyakake respons sing akurat utawa bisa dibandhingake karo algoritma saingan ing kabeh telung set data.
Babagan TAPAS
Pokokna fokus proyek iki yaiku supaya bisa konsultasi, ngolah lan nampilake informasi ana gandhengane karo syarat-syarat pitakon sing digawe dening pangguna nganggo basa alam, kanthi gampang entuk informasi.
Conto dhasar panggunaan TAPAS yaiku yen pangguna pengin ngevaluasi data penjualan, penghasilan, panjaluk, antara liya. Kajaba iku sampeyan kudu nggatekake TAPAS ora mung winates kanggo njupuk informasi saka basis data, nanging uga bisa ngetung, algoritma kasebut nemokake wangsulan ing sel tabel, kanthi langsung uga kanthi tambahan, rata-rata lan operator liyane, uga bisa uga golek wangsulan ing antarane sawetara tabel kanthi bebarengan.
Google Ngucapake Tapas Ngalahake utawa Cocog karo Tiga Algoritma Sumber Terbuka Paling Dhuwur kanggo nganalisis data relasional. Kemampuan Tapas kanggo ngekstrak elemen tartamtu saka repositori data gedhe uga bisa nambah kapabilitas nanggepi.
Underhood, Tapas nggunakake variasi teknik ngolah basa alami BERT digunakake ing telusuran sing ditindakake dening mesin Google.
BERT nyedhiyakake presisi luwih gedhe tinimbang pendekatan tradisional amarga ngidini AI kanggo ngevaluasi urutan teks ora mung saka kiwa menyang tengen utawa nengen ngiwa kaya praktike, nanging uga kalorone bebarengan.
Versi sing dileksanakake Google kanggo TAPAS ngidini AI ora mung mikirake pitakon sing dituduhake dening pangguna lan data sing pengin dikatutake, nanging uga struktur tabel relasional ing data kasebut disimpen.
Kepiye cara nginstal TAPAS ing Linux?
Wiwit TAPAS intine model BERT lan mulane duwe syarat sing padha. Iki tegese model gedhe bisa dilatih kanthi dawa urutan 512 sing mbutuhake TPU.
Supaya bisa nginstal TAPAS ing Linux kita mbutuhake kompilator protokol, sing bisa ditemokake ing sebaran Linux.
Ing Debian, Ubuntu lan turunan kasebut, kita bisa nginstal compiler kanthi printah ing ngisor iki:
sudo apt-get install protobuf-compiler
Ing kasus Arch Linux, Manjaro, Arco Linux utawa turunan liyane saka Arch Linux, kita instal karo:
sudo pacman -S protobuf
Saiki supaya bisa nginstal TAPAS, kita mung kudu entuk kode sumber lan nindakake kompilasi kanthi printah ing ngisor iki:
git clone https://github.com/google-research/tapas
cd tapas
pip install -e .
Lan kanggo mbukak tes, kita nggunakake perpustakaan racun sing bisa mbukak kanthi nelpon:
pip install tox
tox
Saka kene AI kudu dilatih babagan sing dikarepake. Padahal Sawetara model terlatih ditawakake ing repositori GitHub.
Kajaba iku, sampeyan bisa nggunakake macem-macem opsi konfigurasi, kayata opsi kasebut maks_seq_dawane kanggo nggawe urutan sing luwih cekak. Iki bakal nyuda akurasi nanging uga bakal nggawe model GPU-trainable. Pilihan liyane yaiku nyuda ukuran batch (train_batch_size), nanging iki uga bakal mengaruhi akurasi.
Pungkasan yen sampeyan pengin ngerti luwih lengkap babagan iki Babagan AI iki, sampeyan bisa mriksa rincian panggunaan, eksekusi lan informasi liyane Ing link ing ngisor iki.
Dadi pisanan komentar