Google ने "TAPAS" के स्रोत कोड को जारी करने की घोषणा की (टबल पीरिंग), एक तंत्रिका नेटवर्क (कृत्रिम होशियारी) प्राकृतिक भाषा में किसी प्रश्न का उत्तर देने के लिए आंतरिक रूप से विकसित और एक रिलेशनल डेटाबेस या स्प्रेडशीट से उत्तर प्राप्त करें।
TAPAS में इष्टतम परिणाम प्राप्त करने के लिए, परियोजना के प्रभारी डेवलपर्स ने 6.2 मिलियन जोड़े के साथ तंत्रिका नेटवर्क के प्रशिक्षण के लिए खुद को समर्पित किया टेबल से विकिपीडिया से लिया गया पाठ। सत्यापित करने के लिए, तंत्रिका नेटवर्क को दोनों तालिकाओं और उन ग्रंथों में लापता शब्दों को पुनर्स्थापित करना था जिनमें यह प्रशिक्षित नहीं किया गया था। वसूली सटीकता 71,4% थी जैसा कि एक बेंचमार्क परीक्षण से पता चला है कि तंत्रिका नेटवर्क सभी तीन डेटा सेटों में प्रतिद्वंद्वी एल्गोरिदम की तुलना में सटीक या तुलनीय प्रतिक्रियाएं प्रदान करता है।
TAPAS के बारे में
मूल रूप से इस परियोजना का फोकस सूचनाओं से परामर्श, प्रक्रिया और प्रदर्शन करने में सक्षम होना है प्राकृतिक भाषा में उपयोगकर्ता द्वारा बनाई गई क्वेरी की शर्तों से संबंधित, बड़े पैमाने पर जानकारी प्राप्त करने की सुविधा।
TAPAS के उपयोग का एक मूल उदाहरण यदि कोई उपयोगकर्ता बिक्री डेटा, आय का मूल्यांकन करना चाहता है, अनुरोध, अन्य बातों के अलावा। इसके अलावा आपको इस बात का ध्यान रखना होगा कि TAPAS न केवल एक डेटाबेस से जानकारी प्राप्त करने तक सीमित है, बल्कि यह गणना करने में भी सक्षम है, एल्गोरिथ्म तालिकाओं की कोशिकाओं में उत्तर की तलाश करता है, दोनों सीधे और इसके अलावा, औसत और अन्य ऑपरेटरों के माध्यम से, इसके अलावा यह एक ही समय में कई तालिकाओं के बीच उत्तर की तलाश भी कर सकता है।
Google तापस आउटपरफॉर्म या माचिस को टॉप थ्री ओपन सोर्स एल्गोरिदम कहते हैं संबंधपरक डेटा का विश्लेषण करने के लिए। बड़े डेटा रिपॉजिटरी से विशिष्ट वस्तुओं को निकालने की तापस की क्षमता भी प्रतिक्रिया क्षमताओं में सुधार करने के लिए उधार दे सकती है।
टोप के नीचे, तापस BERT प्राकृतिक भाषा प्रसंस्करण तकनीक की एक भिन्नता को रोजगार देता है Google इंजन द्वारा की गई खोजों में उपयोग किया जाता है।
BERT पारंपरिक दृष्टिकोणों की तुलना में अधिक सटीकता प्रदान करता है क्योंकि यह एआई को एक पाठ अनुक्रम का मूल्यांकन करने की अनुमति देता है न केवल बाएं से दाएं या दाएं से बाएं, जैसा कि सामान्य अभ्यास है, लेकिन एक ही समय में दोनों करता है।
Google ने TAPAS के लिए जो संस्करण लागू किया है, वह AI को न केवल उपयोगकर्ताओं और उनके द्वारा क्वेरी किए जाने वाले डेटा, बल्कि डेटा को संग्रहीत करने वाली रिलेशनल तालिकाओं की संरचना पर विचार करने पर भी विचार करने की अनुमति देता है।
लिनक्स पर TAPAS कैसे स्थापित करें?
यह देखते हुए कि TAPAS मूल रूप से BERT मॉडल है और इसलिए इसकी आवश्यकताएं समान हैं। इसका मतलब यह है कि 512 के अनुक्रम लंबाई वाले एक बड़े मॉडल को प्रशिक्षित किया जा सकता है, जिसे टीपीयू की आवश्यकता होगी।
लिनक्स पर TAPAS स्थापित करने में सक्षम होने के लिए हमें प्रोटोकॉल कंपाइलर की आवश्यकता है, जो अधिकांश लिनक्स वितरण पर पाया जा सकता है।
इनमें से डेबियन, उबंटू और डेरिवेटिव में, हम निम्नलिखित कमांड के साथ कंपाइलर स्थापित कर सकते हैं:
sudo apt-get install protobuf-compiler
आर्क लिनक्स, मंज़रो, आर्को लिनक्स या आर्क लिनक्स के किसी भी अन्य व्युत्पन्न के मामले में, हम इसके साथ स्थापित करते हैं:
sudo pacman -S protobuf
अब TAPAS स्थापित करने में सक्षम होने के लिए, हमें केवल स्रोत कोड प्राप्त करना होगा और निम्नलिखित कमांड के साथ संकलन करना होगा:
git clone https://github.com/google-research/tapas
cd tapas
pip install -e .
और परीक्षण सूट को चलाने के लिए, हम विषैले पुस्तकालय का उपयोग करते हैं जिसे कॉल करके चलाया जा सकता है:
pip install tox
tox
यहां से, एआई को ब्याज के क्षेत्र में प्रशिक्षित करना होगा। हालांकि कुछ प्रशिक्षित मॉडल GitHub रिपॉजिटरी में पेश किए जाते हैं।
इसके अलावा, आप विभिन्न कॉन्फ़िगरेशन विकल्पों का उपयोग कर सकते हैं, जैसे विकल्प max_seq_length छोटे अनुक्रम बनाने के लिए। यह सटीकता को कम करेगा, लेकिन मॉडल जीपीयू को भी प्रशिक्षित करेगा। एक अन्य विकल्प बैच आकार को कम करना है (ट्रेन_बैच_आकार), लेकिन यह संभावना सटीकता को भी प्रभावित करेगा।
अंत में यदि आप इसके बारे में अधिक जानना चाहते हैं इस AI के बारे में, आप उपयोग, निष्पादन और अन्य जानकारी का विवरण देख सकते हैं निम्नलिखित लिंक में