ហ្គូហ្គោលបានចេញនូវកូដប្រភពនៃអាយអេសអាយ“ តាប៉ាក់” ។

 

ក្រុមហ៊ុន Google បានប្រកាសចេញនូវកូដប្រភពដើមនៃ“ TAPAS” (អាចអនុវត្តបាន) បណ្តាញសរសៃប្រសាទ (បញ្ញាសិប្បនិម្មិត) បង្កើតឡើងនៅខាងក្នុងដើម្បីឆ្លើយសំណួរជាភាសាធម្មជាតិ និងទទួលបានចម្លើយពីមូលដ្ឋានទិន្នន័យទំនាក់ទំនងឬសៀវភៅបញ្ជី។

ដើម្បីទទួលបានលទ្ធផលល្អប្រសើរបំផុតនៅក្នុង TAPAS អ្នកអភិវឌ្ឍន៍ដែលទទួលបន្ទុកគំរោងបានឧទ្ទិសខ្លួនឯងក្នុងការបណ្តុះបណ្តាលបណ្តាញសរសៃប្រសាទជាមួយ ៦,២ លានគូ តារាងអត្ថបទដែលយកចេញពីវិគីភីឌា។ ដើម្បីផ្ទៀងផ្ទាត់បណ្តាញសរសៃប្រសាទត្រូវស្តារពាក្យដែលបាត់ទាំងនៅក្នុងតារាងនិងអត្ថបទដែលវាមិនបានបណ្តុះបណ្តាល។ ភាពជាក់លាក់នៃការងើបឡើងវិញគឺ ៧១,៤% ដូចការធ្វើតេស្តគោលបានបង្ហាញថាបណ្តាញសរសៃប្រសាទផ្តល់ចម្លើយត្រឹមត្រូវឬអាចប្រៀបធៀបបានជាងវិធីដោះស្រាយគូប្រជែងនៅក្នុងសំណុំទិន្នន័យទាំងបី។

អំពី TAPAS

ជាទូទៅ ការផ្តោតអារម្មណ៍នៃគម្រោងនេះគឺដើម្បីអាចពិគ្រោះយោបល់ដំណើរការនិងបង្ហាញព័ត៌មាន ទាក់ទងទៅនឹងលក្ខខណ្ឌនៃសំណួរដែលបានធ្វើឡើងដោយអ្នកប្រើប្រាស់ជាភាសាធម្មជាតិជួយសម្រួលដល់ការទទួលបានព័ត៌មាន។

ឧទាហរណ៍មូលដ្ឋាននៃការប្រើប្រាស់ TAPAS គឺប្រសិនបើអ្នកប្រើប្រាស់ចង់វាយតម្លៃទិន្នន័យការលក់ប្រាក់ចំណូល។ ក្នុងចំណោមរបស់ផ្សេងទៀតសំណើ។ ក្រៅពីនេះអ្នកត្រូវយកមកពិចារណា TAPAS មិនត្រឹមតែត្រូវបានកំណត់ចំពោះការទទួលបានព័ត៌មានពីឃ្លាំងទិន្នន័យប៉ុណ្ណោះទេប៉ុន្តែវាក៏មានសមត្ថភាពអនុវត្តការគណនាផងដែរ, ក្បួនដោះស្រាយរកមើលចម្លើយនៅក្នុងកោសិកាតារាងទាំងដោយផ្ទាល់និងដោយមធ្យោបាយបន្ថែមមធ្យមនិងប្រតិបត្តិករផ្សេងទៀតក្រៅពីនេះវាក៏អាចស្វែងរកចម្លើយរវាងតារាងជាច្រើនក្នុងពេលតែមួយបានដែរ។

ហ្គូហ្គោលនិយាយថាគំរូល្អប្រសើររបស់តាប៉ាសឬផ្គូផ្គងក្បួនដោះស្រាយកូដបើកចំហរកំពូលទាំងបី ដើម្បីវិភាគទិន្នន័យទំនាក់ទំនង។ សមត្ថភាពរបស់តាតាសក្នុងការទាញយកធាតុជាក់លាក់ពីឃ្លាំងទិន្នន័យធំ ៗ ក៏អាចផ្តល់ប្រាក់កម្ចីដោយខ្លួនវាដើម្បីធ្វើឱ្យប្រសើរឡើងនូវសមត្ថភាពឆ្លើយតប។

អាយុក្រោម, តាប៉ាសប្រើបច្ចេកទេសបំលែងភាសាបាសធម្មជាតិ ប្រើក្នុងការស្វែងរកដែលអនុវត្តដោយម៉ាស៊ីនហ្គូហ្គោល។

BERT ផ្តល់នូវភាពជាក់លាក់ខ្ពស់ជាងវិធីសាស្រ្តប្រពៃណី ព្រោះវាអនុញ្ញាតឱ្យអេអាយ។ វាយតំលៃលំដាប់អត្ថបទមិនត្រឹមតែពីឆ្វេងទៅស្តាំឬពីឆ្វេងទៅស្តាំដូចការអនុវត្តធម្មតាប៉ុណ្ណោះទេតែវាក៏ធ្វើទាំងពីរនៅពេលតែមួយផងដែរ។

កំណែដែល Google បានអនុវត្តសម្រាប់ TAPAS អនុញ្ញាតឱ្យ AI ពិចារណាមិនត្រឹមតែសំណួរដែលសួរដោយអ្នកប្រើប្រាស់និងទិន្នន័យដែលពួកគេចង់សាកសួរប៉ុណ្ណោះទេប៉ុន្តែថែមទាំងរចនាសម្ព័ន្ធនៃតារាងទំនាក់ទំនងដែលទិន្នន័យត្រូវបានរក្សាទុក។

តើធ្វើដូចម្តេចដើម្បីតំឡើង TAPAS នៅលើលីនុច?

ចាប់តាំងពី TAPAS ជាម៉ូដែលគំរូ BERT ដែលចាំបាច់ដូច្នេះវាមានតម្រូវការដូចគ្នា។ នេះមានន័យថាគំរូដ៏ធំមួយអាចត្រូវបានទទួលការបណ្តុះបណ្តាលដែលមានប្រវែងលំដាប់ ៥១២ ដែលនឹងតម្រូវឱ្យមាន TPU ។

ដើម្បីអាចតំឡើង TAPAS នៅលើលីនុច យើងត្រូវការអ្នកចងក្រងពិធីសារ ដែលអាចត្រូវបានរកឃើញនៅក្នុងការចែកចាយលីនុចភាគច្រើន។

នៅក្នុងដេបៀនអ៊ូប៊ុនទូនិងនិស្សន្ទវត្ថុនៃកម្មវិធីទាំងនេះយើងអាចតំឡើងកម្មវិធីចងក្រងដោយប្រើពាក្យបញ្ជាដូចខាងក្រោម៖

sudo apt-get install protobuf-compiler

ក្នុងករណី Arch Linux, Manjaro, Arco Linux រឺក៏ទាញយកពី Arch Linux យើងតំឡើងជាមួយ៖

sudo pacman -S protobuf

ឥឡូវដើម្បីអាចតំឡើង TAPAS យើងគ្រាន់តែត្រូវទទួលបានកូដប្រភពហើយចងក្រងជាមួយពាក្យបញ្ជាខាងក្រោម៖

git clone https://github.com/google-research/tapas
cd tapas
pip install -e .

ហើយដើម្បីដំណើរការបន្ទប់សាកល្បងយើងប្រើបណ្ណាល័យជាតិពុលដែលអាចដំណើរការបានដោយការហៅទូរស័ព្ទទៅ៖

pip install tox
tox

ចាប់ពីទីនេះអេអាយអេនឹងត្រូវទទួលការបណ្តុះបណ្តាលនៅក្នុងតំបន់ដែលចាប់អារម្មណ៍។ ទោះបីជា ម៉ូដែលដែលបានទទួលការបណ្តុះបណ្តាលខ្លះត្រូវបានផ្តល់ជូននៅក្នុងឃ្លាំង GitHub ។

លើសពីនេះទៀតអ្នកអាចប្រើជម្រើសកំណត់រចនាសម្ព័ន្ធផ្សេងៗគ្នាដូចជាជម្រើស អតិបរមា _ ប្រវែង _ ប្រវែង ដើម្បីបង្កើតលំដាប់ខ្លីជាង។ នេះនឹងកាត់បន្ថយភាពត្រឹមត្រូវប៉ុន្តែក៏នឹងធ្វើឱ្យម៉ូដែល GPU អាចបណ្តុះបណ្តាលបានផងដែរ។ ជម្រើសមួយទៀតគឺកាត់បន្ថយទំហំបាច់ (រថភ្លើង _ បាច់ _ ទំហំ) ប៉ុន្តែនេះទំនងជាប៉ះពាល់ដល់ភាពត្រឹមត្រូវផងដែរ។

ទីបំផុតប្រសិនបើអ្នកចង់ដឹងបន្ថែមអំពីវា អំពីអេអាយអេនេះអ្នកអាចពិនិត្យមើលព័ត៌មានលម្អិតនៃការប្រើប្រាស់ការប្រតិបត្តិនិងព័ត៌មានផ្សេងទៀត នៅក្នុងតំណខាងក្រោម។


ខ្លឹមសារនៃអត្ថបទប្រកាន់ខ្ជាប់នូវគោលការណ៍របស់យើង ក្រមសីលធម៌វិចារណកថា។ ដើម្បីរាយការណ៍ការចុចកំហុស នៅទីនេះ.

ធ្វើជាយោបល់ដំបូង

ទុកឱ្យយោបល់របស់អ្នក

អាសយដ្ឋានអ៊ីមែលរបស់អ្នកនឹងមិនត្រូវបានបោះពុម្ភ។ អ្នកគួរតែអនុវត្តតាម *

*

*

  1. ទទួលខុសត្រូវចំពោះទិន្នន័យ: មីហ្គែល - ហ្គែលហ្គេតថន
  2. គោលបំណងនៃទិន្នន័យ៖ គ្រប់គ្រង SPAM ការគ្រប់គ្រងមតិយោបល់។
  3. ភាពស្របច្បាប់៖ ការយល់ព្រមរបស់អ្នក
  4. ការប្រាស្រ័យទាក់ទងទិន្នន័យ៖ ទិន្នន័យនឹងមិនត្រូវបានទាក់ទងទៅភាគីទីបីឡើយលើកលែងតែកាតព្វកិច្ចផ្នែកច្បាប់។
  5. ការផ្ទុកទិន្នន័យ៖ មូលដ្ឋានទិន្នន័យដែលរៀបចំដោយបណ្តាញ Occentus (EU)
  6. សិទ្ធិ៖ នៅពេលណាដែលអ្នកអាចដាក់កម្រិតទាញយកមកវិញនិងលុបព័ត៌មានរបស់អ្នក។