Google julkaisi tekoälyn "TAPAS" lähdekoodin

Google ilmoitti TAPAS-lähdekoodin julkaisemisesta (taulukon jäsentäminen), hermoverkko (tekoäly) kehitetty sisäisesti vastaamaan kysymykseen luonnollisella kielellä ja saat vastauksen relaatiotietokannasta tai laskentataulukosta.

Optimaalisten tulosten saamiseksi TAPAS-järjestelmässä projektista vastaavat kehittäjät omistautuivat hermoverkon kouluttamiseen 6.2 miljoonalla parilla taulukosta tekstiin, joka on otettu Wikipediasta. Vahvistamiseksi hermoverkon oli palautettava puuttuvat sanat sekä taulukoissa että teksteissä, joissa sitä ei ollut koulutettu. Saantotarkkuus oli 71,4% vertailutestinä osoitti, että hermoverkko tarjoaa tarkkoja tai vertailukelpoisia vastauksia kuin kilpailevat algoritmit kaikissa kolmessa tietojoukossa.

Tietoja TAPASista

pohjimmiltaan Tämän projektin painopiste on pystyä hakemaan, käsittelemään ja näyttämään tietoja liittyvät käyttäjän luonnollisella kielellä tekemiin kyselyn termeihin, mikä helpottaa tietojen hankkimista laajasti.

Perusesimerkki TAPAS: n käytöstä on, jos käyttäjä haluaa arvioida myyntitiedot, tulot, pyyntöjä muun muassa. Sen lisäksi sinun on otettava tämä huomioon TAPAS ei rajoitu pelkästään tietojen hankkimiseen tietokannasta, vaan se pystyy myös suorittamaan laskelmia, algoritmi etsii vastausta taulukoiden soluista sekä suoraan että lisäys-, keskiarvottamis- ja muiden operaattoreiden avulla, sen lisäksi, että se voi myös etsiä vastausta useiden taulukoiden välillä samanaikaisesti.

Google sanoo, että tapakset menestyvät tai vastaavat kolmea avoimen lähdekoodin algoritmia analysoida relaatiotietoja. Tapaksen kyky poimia tiettyjä kohteita suurista tietovarastoista voisi myös auttaa parantamaan vastaamisominaisuuksia.

Hupun alla, Tapas käyttää erilaista BERT-kielenkäsittelytekniikkaa käytetään Google-moottorin tekemissä hauissa.

BERT tarjoaa parempaa tarkkuutta kuin perinteiset lähestymistavat koska sen avulla tekoäly voi arvioida tekstisekvenssin paitsi vasemmalta oikealle tai oikealta vasemmalle, kuten tavallista, vaan tekee molemmat samanaikaisesti.

Googlen TAPAS-järjestelmälle toteuttama versio antaa tekoälylle mahdollisuuden ottaa huomioon käyttäjien esittämät kysymykset ja kyseltävät tiedot, mutta myös niiden relaatiotaulukoiden rakenne, joihin tiedot on tallennettu.

Kuinka asentaa TAPAS Linuxiin?

Dado que TAPAS on pohjimmiltaan BERT-malli, ja siksi sillä on samat vaatimukset. Tämä tarkoittaa, että suuri malli voidaan kouluttaa jakson pituudella 512, joka vaatii TPU: n.

TAPASin asentaminen Linuxiin tarvitsemme protokollankääntäjän, joka löytyy useimmista Linux-jakeluista.

Debianissa, Ubuntussa ja näiden johdannaisissa voimme asentaa kääntäjän seuraavalla komennolla:

sudo apt-get install protobuf-compiler

Arch Linuxin, Manjaron, Arco Linuxin tai muun Arch Linuxin johdannaisen tapauksessa asennamme:

sudo pacman -S protobuf

Nyt TAPASin asentamiseksi meidän on hankittava vain lähdekoodi ja käännettävä seuraavilla komennoilla:

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

Ja testipaketin suorittamiseksi käytämme tox-kirjastoa, joka voidaan suorittaa soittamalla:

pip install tox
tox

Sieltä tekoäly on koulutettava kiinnostavalla alueella. Vaikka Joitakin koulutettuja malleja tarjotaan GitHub-arkistossa.

Lisäksi voit käyttää erilaisia ​​kokoonpanovaihtoehtoja, kuten vaihtoehtoa max_seq_length luoda lyhyempiä sekvenssejä. Tämä vähentää tarkkuutta, mutta tekee myös mallista GPU-koulutettavan. Toinen vaihtoehto on pienentää erän kokoa (juna_erä_koko), mutta tämä todennäköisesti vaikuttaa myös tarkkuuteen.

Lopuksi, jos haluat tietää enemmän siitä Tietoja tästä tekoälystä voit tarkistaa yksityiskohdat käytöstä, suorituksesta ja muista tiedoista Seuraavassa linkissä.


Ole ensimmäinen kommentti

Jätä kommentti

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *

*

*

  1. Vastuussa tiedoista: Miguel Ángel Gatón
  2. Tietojen tarkoitus: Roskapostin hallinta, kommenttien hallinta.
  3. Laillistaminen: Suostumuksesi
  4. Tietojen välittäminen: Tietoja ei luovuteta kolmansille osapuolille muutoin kuin lain nojalla.
  5. Tietojen varastointi: Occentus Networks (EU) isännöi tietokantaa
  6. Oikeudet: Voit milloin tahansa rajoittaa, palauttaa ja poistaa tietojasi.