Η Google κυκλοφόρησε τον πηγαίο κώδικα του AI "TAPAS"

Η Google ανακοίνωσε την κυκλοφορία του πηγαίου κώδικα του "TAPAS" (Table ParSing), ένα νευρωνικό δίκτυο (τεχνητή νοημοσύνη) αναπτύχθηκε εσωτερικά για να απαντήσει σε μια ερώτηση στη φυσική γλώσσα και λάβετε την απάντηση από μια σχεσιακή βάση δεδομένων ή υπολογιστικό φύλλο.

Προκειμένου να επιτευχθούν τα βέλτιστα αποτελέσματα στο TAPAS, Οι υπεύθυνοι για την ανάπτυξη του έργου αφιερώθηκαν στην εκπαίδευση του νευρικού δικτύου με 6.2 εκατομμύρια ζευγάρια πίνακας σε κείμενο που λαμβάνεται από τη Wikipedia. Για να επαληθευτεί, το νευρικό δίκτυο έπρεπε να επαναφέρει τις λείπουν λέξεις τόσο στους πίνακες όσο και στα κείμενα στα οποία δεν είχε εκπαιδευτεί. Η ακρίβεια ανάκτησης ήταν 71,4% ως δείγμα αναφοράς έδειξε ότι το νευρικό δίκτυο παρέχει ακριβείς ή συγκρίσιμες απαντήσεις από τους ανταγωνιστικούς αλγόριθμους και στα τρία σύνολα δεδομένων.

Σχετικά με τον TAPAS

Βασικά το επίκεντρο αυτού του έργου είναι να είναι σε θέση να συμβουλεύεται, να επεξεργάζεται και να εμφανίζει πληροφορίες σχετίζονται με τους όρους του ερωτήματος που υποβάλλει ο χρήστης σε φυσική γλώσσα, διευκολύνοντας σε μεγάλο βαθμό τη λήψη πληροφοριών.

Ένα βασικό παράδειγμα της χρήσης του TAPAS είναι εάν ένας χρήστης θέλει να αξιολογήσει τα δεδομένα πωλήσεων, τα έσοδα, αιτήματα, μεταξύ άλλων. Εκτός αυτού πρέπει να το λάβετε υπόψη Το TAPAS δεν περιορίζεται μόνο στη λήψη πληροφοριών από μια βάση δεδομένων, αλλά είναι επίσης σε θέση να εκτελεί υπολογισμούς, ο αλγόριθμος αναζητά την απάντηση στα κελιά του πίνακα, τόσο άμεσα όσο και μέσω προσθήκης, με μέσο όρο και άλλους χειριστές, εκτός από αυτό μπορεί επίσης να αναζητήσει την απάντηση μεταξύ πολλών πινάκων ταυτόχρονα.

Το Google Λέει ότι το Tapas υπερτερεί ή αντιστοιχεί στους τρεις πρώτους αλγόριθμους ανοιχτού κώδικα για την ανάλυση σχεσιακών δεδομένων. Η ικανότητα του Tapas να εξάγει συγκεκριμένα στοιχεία από μεγάλα αποθετήρια δεδομένων θα μπορούσε επίσης να προσφέρεται για τη βελτίωση των δυνατοτήτων απόκρισης.

Κάτω Η Tapas χρησιμοποιεί μια παραλλαγή της τεχνικής επεξεργασίας φυσικής γλώσσας του BERT χρησιμοποιείται σε αναζητήσεις που πραγματοποιούνται από τη μηχανή Google.

Το BERT παρέχει μεγαλύτερη ακρίβεια από τις παραδοσιακές προσεγγίσεις επειδή επιτρέπει σε ένα AI να αξιολογήσει μια ακολουθία κειμένου όχι μόνο από αριστερά προς τα δεξιά ή από τα δεξιά προς τα αριστερά, όπως είναι η συνήθης πρακτική, αλλά και τα δύο ταυτόχρονα.

Η έκδοση που εφάρμοσε η Google για το TAPAS επιτρέπει στο AI να εξετάσει όχι μόνο την ερώτηση που θέτουν οι χρήστες και τα δεδομένα που θέλουν να υποβάλουν ερώτημα, αλλά και τη δομή των σχετικών πινάκων στους οποίους αποθηκεύονται τα δεδομένα.

Πώς να εγκαταστήσετε το TAPAS σε Linux;

δοθέντος ότι Το TAPAS είναι ουσιαστικά ένα μοντέλο BERT και επομένως έχει τις ίδιες απαιτήσεις. Αυτό σημαίνει ότι ένα μεγάλο μοντέλο μπορεί να εκπαιδευτεί με μήκος ακολουθίας 512 το οποίο θα απαιτεί TPU.

Για να μπορέσετε να εγκαταστήσετε το TAPAS σε Linux απαιτούμε τον μεταγλωττιστή πρωτοκόλλου, που μπορεί να βρεθεί στις περισσότερες διανομές Linux.

Στο Debian, το Ubuntu και τα παράγωγά τους, μπορούμε να εγκαταστήσουμε τον μεταγλωττιστή με την ακόλουθη εντολή:

sudo apt-get install protobuf-compiler

Στην περίπτωση των Arch Linux, Manjaro, Arco Linux ή οποιουδήποτε άλλου παραγώγου του Arch Linux, εγκαθιστούμε με:

sudo pacman -S protobuf

Τώρα για να μπορέσουμε να εγκαταστήσουμε το TAPAS, πρέπει απλώς να λάβουμε τον πηγαίο κώδικα και να συντάξουμε με τις ακόλουθες εντολές:

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

Και για να εκτελέσουμε τη δοκιμαστική σουίτα, χρησιμοποιούμε τη βιβλιοθήκη tox που μπορεί να εκτελεστεί καλώντας:

pip install tox
tox

Από εδώ το AI θα πρέπει να εκπαιδευτεί στον τομέα ενδιαφέροντος. Αν και Μερικά εκπαιδευμένα μοντέλα προσφέρονται στο αποθετήριο GitHub.

Επιπλέον, μπορείτε να χρησιμοποιήσετε διαφορετικές επιλογές διαμόρφωσης, όπως η επιλογή max_seq_length για να δημιουργήσετε μικρότερες ακολουθίες. Αυτό θα μειώσει την ακρίβεια αλλά θα κάνει επίσης το μοντέλο GPU εκπαιδευμένο. Μια άλλη επιλογή είναι να μειώσετε το μέγεθος της παρτίδας (size_batch_size), αλλά αυτό πιθανότατα θα επηρεάσει και την ακρίβεια.

Τέλος, αν θέλετε να μάθετε περισσότερα για αυτό Σχετικά με αυτό το AI, μπορείτε να ελέγξετε τις λεπτομέρειες χρήσης, εκτέλεσης και άλλων πληροφοριών Στον ακόλουθο σύνδεσμο.


Αφήστε το σχόλιό σας

Η διεύθυνση email σας δεν θα δημοσιευθεί. Τα υποχρεωτικά πεδία σημειώνονται με *

*

*

  1. Υπεύθυνος για τα δεδομένα: Miguel Ángel Gatón
  2. Σκοπός των δεδομένων: Έλεγχος SPAM, διαχείριση σχολίων.
  3. Νομιμοποίηση: Η συγκατάθεσή σας
  4. Κοινοποίηση των δεδομένων: Τα δεδομένα δεν θα κοινοποιούνται σε τρίτους, εκτός από νομική υποχρέωση.
  5. Αποθήκευση δεδομένων: Βάση δεδομένων που φιλοξενείται από τα δίκτυα Occentus (ΕΕ)
  6. Δικαιώματα: Ανά πάσα στιγμή μπορείτε να περιορίσετε, να ανακτήσετε και να διαγράψετε τις πληροφορίες σας.