ដើម្បីទទួលបានលទ្ធផលល្អប្រសើរបំផុតនៅក្នុង TAPAS អ្នកអភិវឌ្ឍន៍ដែលទទួលបន្ទុកគំរោងបានឧទ្ទិសខ្លួនឯងក្នុងការបណ្តុះបណ្តាលបណ្តាញសរសៃប្រសាទជាមួយ ៦,២ លានគូ តារាងអត្ថបទដែលយកចេញពីវិគីភីឌា។ ដើម្បីផ្ទៀងផ្ទាត់បណ្តាញសរសៃប្រសាទត្រូវស្តារពាក្យដែលបាត់ទាំងនៅក្នុងតារាងនិងអត្ថបទដែលវាមិនបានបណ្តុះបណ្តាល។ ភាពជាក់លាក់នៃការងើបឡើងវិញគឺ ៧១,៤% ដូចការធ្វើតេស្តគោលបានបង្ហាញថាបណ្តាញសរសៃប្រសាទផ្តល់ចម្លើយត្រឹមត្រូវឬអាចប្រៀបធៀបបានជាងវិធីដោះស្រាយគូប្រជែងនៅក្នុងសំណុំទិន្នន័យទាំងបី។
អំពី TAPAS
ជាទូទៅ ការផ្តោតអារម្មណ៍នៃគម្រោងនេះគឺដើម្បីអាចពិគ្រោះយោបល់ដំណើរការនិងបង្ហាញព័ត៌មាន ទាក់ទងទៅនឹងលក្ខខណ្ឌនៃសំណួរដែលបានធ្វើឡើងដោយអ្នកប្រើប្រាស់ជាភាសាធម្មជាតិជួយសម្រួលដល់ការទទួលបានព័ត៌មាន។
ឧទាហរណ៍មូលដ្ឋាននៃការប្រើប្រាស់ TAPAS គឺប្រសិនបើអ្នកប្រើប្រាស់ចង់វាយតម្លៃទិន្នន័យការលក់ប្រាក់ចំណូល។ ក្នុងចំណោមរបស់ផ្សេងទៀតសំណើ។ ក្រៅពីនេះអ្នកត្រូវយកមកពិចារណា TAPAS មិនត្រឹមតែត្រូវបានកំណត់ចំពោះការទទួលបានព័ត៌មានពីឃ្លាំងទិន្នន័យប៉ុណ្ណោះទេប៉ុន្តែវាក៏មានសមត្ថភាពអនុវត្តការគណនាផងដែរ, ក្បួនដោះស្រាយរកមើលចម្លើយនៅក្នុងកោសិកាតារាងទាំងដោយផ្ទាល់និងដោយមធ្យោបាយបន្ថែមមធ្យមនិងប្រតិបត្តិករផ្សេងទៀតក្រៅពីនេះវាក៏អាចស្វែងរកចម្លើយរវាងតារាងជាច្រើនក្នុងពេលតែមួយបានដែរ។
ហ្គូហ្គោលនិយាយថាគំរូល្អប្រសើររបស់តាប៉ាសឬផ្គូផ្គងក្បួនដោះស្រាយកូដបើកចំហរកំពូលទាំងបី ដើម្បីវិភាគទិន្នន័យទំនាក់ទំនង។ សមត្ថភាពរបស់តាតាសក្នុងការទាញយកធាតុជាក់លាក់ពីឃ្លាំងទិន្នន័យធំ ៗ ក៏អាចផ្តល់ប្រាក់កម្ចីដោយខ្លួនវាដើម្បីធ្វើឱ្យប្រសើរឡើងនូវសមត្ថភាពឆ្លើយតប។
អាយុក្រោម, តាប៉ាសប្រើបច្ចេកទេសបំលែងភាសាបាសធម្មជាតិ ប្រើក្នុងការស្វែងរកដែលអនុវត្តដោយម៉ាស៊ីនហ្គូហ្គោល។
BERT ផ្តល់នូវភាពជាក់លាក់ខ្ពស់ជាងវិធីសាស្រ្តប្រពៃណី ព្រោះវាអនុញ្ញាតឱ្យអេអាយ។ វាយតំលៃលំដាប់អត្ថបទមិនត្រឹមតែពីឆ្វេងទៅស្តាំឬពីឆ្វេងទៅស្តាំដូចការអនុវត្តធម្មតាប៉ុណ្ណោះទេតែវាក៏ធ្វើទាំងពីរនៅពេលតែមួយផងដែរ។
កំណែដែល Google បានអនុវត្តសម្រាប់ TAPAS អនុញ្ញាតឱ្យ AI ពិចារណាមិនត្រឹមតែសំណួរដែលសួរដោយអ្នកប្រើប្រាស់និងទិន្នន័យដែលពួកគេចង់សាកសួរប៉ុណ្ណោះទេប៉ុន្តែថែមទាំងរចនាសម្ព័ន្ធនៃតារាងទំនាក់ទំនងដែលទិន្នន័យត្រូវបានរក្សាទុក។
តើធ្វើដូចម្តេចដើម្បីតំឡើង TAPAS នៅលើលីនុច?
ចាប់តាំងពី TAPAS ជាម៉ូដែលគំរូ BERT ដែលចាំបាច់ដូច្នេះវាមានតម្រូវការដូចគ្នា។ នេះមានន័យថាគំរូដ៏ធំមួយអាចត្រូវបានទទួលការបណ្តុះបណ្តាលដែលមានប្រវែងលំដាប់ ៥១២ ដែលនឹងតម្រូវឱ្យមាន TPU ។
ដើម្បីអាចតំឡើង TAPAS នៅលើលីនុច យើងត្រូវការអ្នកចងក្រងពិធីសារ ដែលអាចត្រូវបានរកឃើញនៅក្នុងការចែកចាយលីនុចភាគច្រើន។
នៅក្នុងដេបៀនអ៊ូប៊ុនទូនិងនិស្សន្ទវត្ថុនៃកម្មវិធីទាំងនេះយើងអាចតំឡើងកម្មវិធីចងក្រងដោយប្រើពាក្យបញ្ជាដូចខាងក្រោម៖
sudo apt-get install protobuf-compiler
ក្នុងករណី Arch Linux, Manjaro, Arco Linux រឺក៏ទាញយកពី Arch Linux យើងតំឡើងជាមួយ៖
sudo pacman -S protobuf
ឥឡូវដើម្បីអាចតំឡើង TAPAS យើងគ្រាន់តែត្រូវទទួលបានកូដប្រភពហើយចងក្រងជាមួយពាក្យបញ្ជាខាងក្រោម៖
git clone https://github.com/google-research/tapas
cd tapas
pip install -e .
ហើយដើម្បីដំណើរការបន្ទប់សាកល្បងយើងប្រើបណ្ណាល័យជាតិពុលដែលអាចដំណើរការបានដោយការហៅទូរស័ព្ទទៅ៖
pip install tox
tox
ចាប់ពីទីនេះអេអាយអេនឹងត្រូវទទួលការបណ្តុះបណ្តាលនៅក្នុងតំបន់ដែលចាប់អារម្មណ៍។ ទោះបីជា ម៉ូដែលដែលបានទទួលការបណ្តុះបណ្តាលខ្លះត្រូវបានផ្តល់ជូននៅក្នុងឃ្លាំង GitHub ។
លើសពីនេះទៀតអ្នកអាចប្រើជម្រើសកំណត់រចនាសម្ព័ន្ធផ្សេងៗគ្នាដូចជាជម្រើស អតិបរមា _ ប្រវែង _ ប្រវែង ដើម្បីបង្កើតលំដាប់ខ្លីជាង។ នេះនឹងកាត់បន្ថយភាពត្រឹមត្រូវប៉ុន្តែក៏នឹងធ្វើឱ្យម៉ូដែល GPU អាចបណ្តុះបណ្តាលបានផងដែរ។ ជម្រើសមួយទៀតគឺកាត់បន្ថយទំហំបាច់ (រថភ្លើង _ បាច់ _ ទំហំ) ប៉ុន្តែនេះទំនងជាប៉ះពាល់ដល់ភាពត្រឹមត្រូវផងដែរ។
ទីបំផុតប្រសិនបើអ្នកចង់ដឹងបន្ថែមអំពីវា អំពីអេអាយអេនេះអ្នកអាចពិនិត្យមើលព័ត៌មានលម្អិតនៃការប្រើប្រាស់ការប្រតិបត្តិនិងព័ត៌មានផ្សេងទៀត នៅក្នុងតំណខាងក្រោម។
ធ្វើជាយោបល់ដំបូង