גוגל פרסמה את קוד המקור של AI "TAPAS" שלה

 

גוגל הודיעה על שחרור קוד המקור של "TAPAS" (TABEL PARSing), רשת עצבית (בינה מלאכותית) התפתח באופן פנימי על מנת לענות על שאלה בשפה טבעית ולקבל את התשובה ממאגר מידע או מגיליון אלקטרוני.

על מנת להשיג תוצאות אופטימליות ב- TAPAS, היזמים האחראים על הפרויקט הקדישו את עצמם להכשרת הרשת העצבית עם 6.2 מיליון זוגות טבלה לטקסט שנלקח מוויקיפדיה. כדי לאמת, הרשת העצבית נאלצה לשחזר את המילים החסרות הן בטבלאות והן בטקסטים שבהם לא הוכשרה. דיוק ההתאוששות היה 71,4% כמבחן אמת מידה הראה כי הרשת העצבית מספקת תשובות מדויקות או דומות בהשוואה לאלגוריתמים יריבים בכל שלושת מערכי הנתונים.

אודות טאפאס

בעיקרון המוקד של פרויקט זה הוא להיות מסוגל להתייעץ, לעבד ולהציג מידע הקשורים לתנאי השאילתה שהמשתמש עשה בשפה טבעית, מה שמאפשר בקנה מידה גדול את השגת המידע.

דוגמה בסיסית לשימוש ב- TAPAS היא אם משתמש רוצה להעריך נתוני מכירות, הכנסה, מבקש, בין היתר. חוץ מזה אתה צריך לקחת בחשבון את זה TAPAS אינו מוגבל רק להשגת מידע ממסד נתונים, אלא הוא גם מסוגל לבצע חישובים, האלגוריתם מחפש את התשובה בתאי הטבלה, באופן ישיר ובאמצעות תוספות, ממוצעים ומפעילים אחרים, בנוסף לכך הוא יכול גם לחפש את התשובה בין מספר טבלאות בו זמנית.

גוגל אומרת שטאפאס עולה על ביצועי ביצועים טובים יותר משלושת האלגוריתמים המקור הפתוח לנתח נתונים יחסיים. היכולת של טאפאס לחלץ אלמנטים ספציפיים ממאגרי נתונים גדולים יכולה גם להשאיל את עצמה לשיפור יכולות התגובה.

תחתון, טאפאס משתמשת בווריאציה של טכניקת עיבוד השפה הטבעית BERT משמש בחיפושים שבוצעו על ידי מנוע גוגל.

BERT מספק דיוק גדול יותר מגישות מסורתיות מכיוון שהוא מאפשר ל- AI להעריך רצף טקסט לא רק משמאל לימין או מימין לשמאל כמקובל, אלא עושה את שניהם בו זמנית.

הגרסה שגוגל יישמה עבור TAPAS מאפשרת למדעי המחשב לשקול לא רק את השאלה שהציבו המשתמשים ואת הנתונים שהם רוצים לשאול, אלא גם את מבנה טבלאות ההתייחסות בהן נשמרים הנתונים.

כיצד להתקין את TAPAS בלינוקס?

מאז TAPAS הוא למעשה מודל BERT ולכן יש לו את אותן הדרישות. המשמעות היא שניתן לאמן מודל גדול באורך רצף של 512 אשר ידרוש TPU.

כדי להיות מסוגל להתקין את TAPAS בלינוקס אנו דורשים את מהדר הפרוטוקול, אשר ניתן למצוא ברוב הפצות לינוקס.

בדביאן, אובונטו ונגזרות של אלה, אנו יכולים להתקין את המהדר עם הפקודה הבאה:

sudo apt-get install protobuf-compiler

במקרה של Arch Linux, Manjaro, Arco Linux או כל נגזרת אחרת של Arch Linux, אנו מתקינים עם:

sudo pacman -S protobuf

כעת, על מנת להתקין את TAPAS, עלינו להשיג את קוד המקור ולהרכיב את הפקודות הבאות:

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

וכדי להפעיל את חבילת הבדיקה, אנו משתמשים בספריית הרעלים שניתן להריץ באמצעות שיחה:

pip install tox
tox

מכאן יהיה צורך להכשיר את ה- AI בתחום העניין. אם כי כמה דגמים מאומנים מוצעים במאגר GitHub.

בנוסף, תוכלו להשתמש באפשרויות תצורה שונות, כמו האפשרות max_seq_length כדי ליצור רצפים קצרים יותר. זה יפחית את הדיוק אך גם יהפוך את הדגם לאימון GPU. אפשרות נוספת היא להקטין את גודל האצווה (רכבת_מידה_גודל), אך סביר להניח שהדבר ישפיע גם על הדיוק.

סוף סוף אם אתה רוצה לדעת יותר על זה לגבי AI זה, אתה יכול לבדוק את פרטי השימוש, הביצוע ומידע אחר בקישור הבא.


תוכן המאמר עומד בעקרונותינו של אתיקה עריכתית. כדי לדווח על שגיאה לחץ כאן.

היה הראשון להגיב

השאירו את התגובה שלכם

כתובת הדוא"ל שלך לא תפורסם. שדות חובה מסומנים *

*

*

  1. אחראי לנתונים: מיגל אנחל גטון
  2. מטרת הנתונים: בקרת ספאם, ניהול תגובות.
  3. לגיטימציה: הסכמתך
  4. מסירת הנתונים: הנתונים לא יועברו לצדדים שלישיים אלא בהתחייבות חוקית.
  5. אחסון נתונים: מסד נתונים המתארח על ידי Occentus Networks (EU)
  6. זכויות: בכל עת תוכל להגביל, לשחזר ולמחוק את המידע שלך.