गुगलने त्याच्या एआय "टॅपस" चा स्त्रोत कोड जारी केला

गुगलने "टॅप्स" चा स्त्रोत कोड जाहीर करण्याची घोषणा केली (टेबल पेर्सिंग), एक मज्जासंस्था नेटवर्क (कृत्रिम बुद्धिमत्ता) नैसर्गिक भाषेत एखाद्या प्रश्नाचे उत्तर देण्यासाठी आंतरिक विकसित केले आणि रिलेशनल डेटाबेस किंवा स्प्रेडशीटवरुन उत्तर मिळवा.

टॅपसमध्ये इष्टतम निकाल प्राप्त करण्यासाठी, प्रकल्पाचे प्रभारी विकसकांनी 6.2 दशलक्ष जोड्यांसह तंत्रिका नेटवर्कचे प्रशिक्षण देण्यास स्वत: ला समर्पित केले विकिपीडिया पासून मजकूर सारणी. सत्यापित करण्यासाठी, तंत्रिका नेटवर्कला गहाळ शब्द सारण्यांमध्ये आणि ज्या मजकूरात ज्याचे प्रशिक्षण दिले गेले नव्हते त्या दोन्हीमध्ये पुनर्संचयित करावे लागले. पुनर्प्राप्तीची अचूकता 71,4% होती बेंचमार्क चाचणीनुसार हे सिद्ध झाले की तंत्रिका नेटवर्क सर्व तीन डेटा सेटमधील प्रतिस्पर्धी अल्गोरिदमपेक्षा अचूक किंवा तुलनात्मक उत्तरे प्रदान करते.

टॅप्स बद्दल

मुळात या प्रकल्पाचे लक्ष केंद्रित करणे, प्रक्रिया करणे आणि माहिती प्रदर्शित करण्यात सक्षम असणे हे आहे वापरकर्त्याने नैसर्गिक भाषेत केलेल्या क्वेरीच्या अटींशी संबंधित, मोठ्या प्रमाणात माहिती मिळविणे सुलभ करते.

टॅपसच्या वापराचे मूलभूत उदाहरण म्हणजे जर वापरकर्त्याने विक्री डेटा, उत्पन्न, विनंत्या, इतर गोष्टींबरोबरच. त्याशिवाय आपल्याला ते ध्यानात घ्यावे लागेल टॅप्स केवळ डेटाबेसमधून माहिती मिळवण्यापुरते मर्यादित नाही तर गणना करण्यास देखील सक्षम आहे, अल्गोरिदम सारख्या पेशींमध्ये उत्तर शोधतो, थेट आणि त्या व्यतिरिक्त, सरासरी आणि इतर ऑपरेटर, त्या व्यतिरिक्त ते एकाच वेळी बर्‍याच टेबलांमधील उत्तर शोधू शकतात.

गूगल म्हणतो तापस आउटपर्फॉर्म किंवा टॉप थ्री ओपन सोर्स अल्गोरिदमशी जुळते रिलेशनल डेटाचे विश्लेषण करणे. मोठ्या डेटा रेपॉजिटरीमधून विशिष्ट घटक काढण्याची तपसांची क्षमता देखील प्रतिसादाची क्षमता सुधारण्यासाठी कर्ज देऊ शकते.

अंडरहूड, तपसमध्ये बीईआरटी नैसर्गिक भाषा प्रक्रिया तंत्रात भिन्नता आहे Google इंजिनद्वारे केलेल्या शोधांमध्ये वापरलेले.

बीईआरटी पारंपारिक पध्दतीपेक्षा अधिक सुस्पष्टता प्रदान करते कारण हे एआयला नेहमीच्या प्रथेप्रमाणेच डावीकडून उजवीकडे किंवा डावीकडून मजकूर क्रमवार मूल्यांकनास अनुमती देते परंतु हे दोन्ही एकाच वेळी करते.

गुगलने टॅप्ससाठी लागू केलेली आवृत्ती एआयला केवळ वापरकर्त्यांद्वारे विचारलेल्या प्रश्नावर आणि त्यांना क्वेरी करू इच्छित असलेल्या डेटाचाच नव्हे तर डेटा संग्रहित केलेल्या रिलेशनल टेबल्सची रचना विचारात घेण्यास अनुमती देते.

लिनक्सवर टॅपस कसे स्थापित करावे?

असल्याने टॅपस मूलत: एक बीईआरटी मॉडेल आहे आणि म्हणूनच त्याच आवश्यकता आहेत. याचा अर्थ असा की मोठ्या मॉडेलला 512 सीक्वेन्स लांबीसह प्रशिक्षण दिले जाऊ शकते ज्यास एक टीपीयू आवश्यक असेल.

लिनक्सवर टॅपस स्थापित करण्यास सक्षम होण्यासाठी आम्हाला प्रोटोकॉल कंपाईलर आवश्यक आहे, जे बहुतांश लिनक्स वितरणात आढळू शकते.

डेबियन, उबंटू आणि यातील डेरिव्हेटिव्ह्जमध्ये आपण खालील आदेशासह कंपाईलर स्थापित करू शकतो.

sudo apt-get install protobuf-compiler

आर्च लिनक्स, मांजरो, आर्को लिनक्स किंवा आर्च लिनक्सच्या इतर व्युत्पत्तीच्या बाबतीत, आम्ही हे सह स्थापित करतोः

sudo pacman -S protobuf

आता टॅप्स स्थापित करण्यास सक्षम होण्यासाठी, आम्हाला फक्त स्त्रोत कोड प्राप्त करावा लागेल आणि खालील आदेशांचे संकलन करावे लागेल:

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

आणि चाचणी संच चालविण्यासाठी, आम्ही टॉक्स लायब्ररी वापरतो जी कॉल करून चालविली जाऊ शकते:

pip install tox
tox

येथून एआयला आवडीच्या क्षेत्रात प्रशिक्षण द्यावे लागेल. तरी काही प्रशिक्षित मॉडेल्स गीटहब रेपॉजिटरीमध्ये उपलब्ध आहेत.

याव्यतिरिक्त, आपण विविध कॉन्फिगरेशन पर्याय वापरू शकता, जसे की पर्याय कमाल_सेक_कौशल्य लहान क्रम तयार करण्यासाठी. हे अचूकता कमी करेल परंतु जीपीयू-प्रशिक्षित मॉडेल देखील करेल. दुसरा पर्याय म्हणजे बॅचचा आकार कमी करणे (ट्रेन_बॅच_ आकार), परंतु यामुळे कदाचित अचूकतेवरही परिणाम होईल.

शेवटी आपण त्याबद्दल अधिक जाणून घेऊ इच्छित असल्यास या एआयबद्दल आपण वापर, अंमलबजावणी आणि अन्य माहितीचा तपशील तपासू शकता पुढील लिंकवर


आपली टिप्पणी द्या

आपला ई-मेल पत्ता प्रकाशित केला जाणार नाही. आवश्यक फील्ड चिन्हांकित केले आहेत *

*

*

  1. डेटा जबाबदार: मिगुएल Áन्गल गॅटन
  2. डेटाचा उद्देशः नियंत्रण स्पॅम, टिप्पणी व्यवस्थापन.
  3. कायदे: आपली संमती
  4. डेटा संप्रेषण: कायदेशीर बंधन वगळता डेटा तृतीय पक्षास कळविला जाणार नाही.
  5. डेटा संग्रहण: ओकेन्टस नेटवर्क (EU) द्वारा होस्ट केलेला डेटाबेस
  6. अधिकारः कोणत्याही वेळी आपण आपली माहिती मर्यादित, पुनर्प्राप्त आणि हटवू शकता.