Google ने अपने AI "TAPAS" का स्रोत कोड जारी किया

Google ने "TAPAS" के स्रोत कोड को जारी करने की घोषणा की (टबल पीरिंग), एक तंत्रिका नेटवर्क (कृत्रिम होशियारी) प्राकृतिक भाषा में किसी प्रश्न का उत्तर देने के लिए आंतरिक रूप से विकसित और एक रिलेशनल डेटाबेस या स्प्रेडशीट से उत्तर प्राप्त करें।

TAPAS में इष्टतम परिणाम प्राप्त करने के लिए, परियोजना के प्रभारी डेवलपर्स ने 6.2 मिलियन जोड़े के साथ तंत्रिका नेटवर्क के प्रशिक्षण के लिए खुद को समर्पित किया टेबल से विकिपीडिया से लिया गया पाठ। सत्यापित करने के लिए, तंत्रिका नेटवर्क को दोनों तालिकाओं और उन ग्रंथों में लापता शब्दों को पुनर्स्थापित करना था जिनमें यह प्रशिक्षित नहीं किया गया था। वसूली सटीकता 71,4% थी जैसा कि एक बेंचमार्क परीक्षण से पता चला है कि तंत्रिका नेटवर्क सभी तीन डेटा सेटों में प्रतिद्वंद्वी एल्गोरिदम की तुलना में सटीक या तुलनीय प्रतिक्रियाएं प्रदान करता है।

TAPAS के बारे में

मूल रूप से इस परियोजना का फोकस सूचनाओं से परामर्श, प्रक्रिया और प्रदर्शन करने में सक्षम होना है प्राकृतिक भाषा में उपयोगकर्ता द्वारा बनाई गई क्वेरी की शर्तों से संबंधित, बड़े पैमाने पर जानकारी प्राप्त करने की सुविधा।

TAPAS के उपयोग का एक मूल उदाहरण यदि कोई उपयोगकर्ता बिक्री डेटा, आय का मूल्यांकन करना चाहता है, अनुरोध, अन्य बातों के अलावा। इसके अलावा आपको इस बात का ध्यान रखना होगा कि TAPAS न केवल एक डेटाबेस से जानकारी प्राप्त करने तक सीमित है, बल्कि यह गणना करने में भी सक्षम है, एल्गोरिथ्म तालिकाओं की कोशिकाओं में उत्तर की तलाश करता है, दोनों सीधे और इसके अलावा, औसत और अन्य ऑपरेटरों के माध्यम से, इसके अलावा यह एक ही समय में कई तालिकाओं के बीच उत्तर की तलाश भी कर सकता है।

Google तापस आउटपरफॉर्म या माचिस को टॉप थ्री ओपन सोर्स एल्गोरिदम कहते हैं संबंधपरक डेटा का विश्लेषण करने के लिए। बड़े डेटा रिपॉजिटरी से विशिष्ट वस्तुओं को निकालने की तापस की क्षमता भी प्रतिक्रिया क्षमताओं में सुधार करने के लिए उधार दे सकती है।

टोप के नीचे, तापस BERT प्राकृतिक भाषा प्रसंस्करण तकनीक की एक भिन्नता को रोजगार देता है Google इंजन द्वारा की गई खोजों में उपयोग किया जाता है।

BERT पारंपरिक दृष्टिकोणों की तुलना में अधिक सटीकता प्रदान करता है क्योंकि यह एआई को एक पाठ अनुक्रम का मूल्यांकन करने की अनुमति देता है न केवल बाएं से दाएं या दाएं से बाएं, जैसा कि सामान्य अभ्यास है, लेकिन एक ही समय में दोनों करता है।

Google ने TAPAS के लिए जो संस्करण लागू किया है, वह AI को न केवल उपयोगकर्ताओं और उनके द्वारा क्वेरी किए जाने वाले डेटा, बल्कि डेटा को संग्रहीत करने वाली रिलेशनल तालिकाओं की संरचना पर विचार करने पर भी विचार करने की अनुमति देता है।

लिनक्स पर TAPAS कैसे स्थापित करें?

यह देखते हुए कि TAPAS मूल रूप से BERT मॉडल है और इसलिए इसकी आवश्यकताएं समान हैं। इसका मतलब यह है कि 512 के अनुक्रम लंबाई वाले एक बड़े मॉडल को प्रशिक्षित किया जा सकता है, जिसे टीपीयू की आवश्यकता होगी।

लिनक्स पर TAPAS स्थापित करने में सक्षम होने के लिए हमें प्रोटोकॉल कंपाइलर की आवश्यकता है, जो अधिकांश लिनक्स वितरण पर पाया जा सकता है।

इनमें से डेबियन, उबंटू और डेरिवेटिव में, हम निम्नलिखित कमांड के साथ कंपाइलर स्थापित कर सकते हैं:

sudo apt-get install protobuf-compiler

आर्क लिनक्स, मंज़रो, आर्को लिनक्स या आर्क लिनक्स के किसी भी अन्य व्युत्पन्न के मामले में, हम इसके साथ स्थापित करते हैं:

sudo pacman -S protobuf

अब TAPAS स्थापित करने में सक्षम होने के लिए, हमें केवल स्रोत कोड प्राप्त करना होगा और निम्नलिखित कमांड के साथ संकलन करना होगा:

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

और परीक्षण सूट को चलाने के लिए, हम विषैले पुस्तकालय का उपयोग करते हैं जिसे कॉल करके चलाया जा सकता है:

pip install tox
tox

यहां से, एआई को ब्याज के क्षेत्र में प्रशिक्षित करना होगा। हालांकि कुछ प्रशिक्षित मॉडल GitHub रिपॉजिटरी में पेश किए जाते हैं।

इसके अलावा, आप विभिन्न कॉन्फ़िगरेशन विकल्पों का उपयोग कर सकते हैं, जैसे विकल्प max_seq_length छोटे अनुक्रम बनाने के लिए। यह सटीकता को कम करेगा, लेकिन मॉडल जीपीयू को भी प्रशिक्षित करेगा। एक अन्य विकल्प बैच आकार को कम करना है (ट्रेन_बैच_आकार), लेकिन यह संभावना सटीकता को भी प्रभावित करेगा।

अंत में यदि आप इसके बारे में अधिक जानना चाहते हैं इस AI के बारे में, आप उपयोग, निष्पादन और अन्य जानकारी का विवरण देख सकते हैं निम्नलिखित लिंक में


अपनी टिप्पणी दर्ज करें

आपका ईमेल पता प्रकाशित नहीं किया जाएगा। आवश्यक फ़ील्ड के साथ चिह्नित कर रहे हैं *

*

*

  1. डेटा के लिए जिम्मेदार: मिगुएल elngel Gatón
  2. डेटा का उद्देश्य: नियंत्रण स्पैम, टिप्पणी प्रबंधन।
  3. वैधता: आपकी सहमति
  4. डेटा का संचार: डेटा को कानूनी बाध्यता को छोड़कर तीसरे पक्ष को संचार नहीं किया जाएगा।
  5. डेटा संग्रहण: ऑकेंटस नेटवर्क्स (EU) द्वारा होस्ट किया गया डेटाबेस
  6. अधिकार: किसी भी समय आप अपनी जानकारी को सीमित, पुनर्प्राप्त और हटा सकते हैं।