மொஸில்லா டீப்ஸ்பீச் 0.9 பேச்சு அறிதல் இயந்திரத்தை அறிமுகப்படுத்துகிறது

டீப்ஸ்பீச் 1

வெளியீடு வெளியிடப்பட்டுள்ளது குரல் அங்கீகார இயந்திரம் மொஸில்லா உருவாக்கிய டீப்ஸ்பீச் 0.9, இது கட்டமைப்பை செயல்படுத்துகிறது பேச்சு அங்கீகாரம் பைடு ஆராய்ச்சியாளர்களால் முன்மொழியப்பட்ட அதே பெயரில்.

செயல்படுத்துதல் பயன்படுத்தி பைத்தானில் எழுதப்பட்டுள்ளது இயந்திர கற்றல் தளம் TensorFlow இது இலவச எம்.பி.எல் 2.0 உரிமத்தின் கீழ் விநியோகிக்கப்படுகிறது.

டீப்ஸ்பீச் பற்றி

டீப்ஸ்பீச் இரண்டு துணை அமைப்புகளைக் கொண்டுள்ளது: ஒரு ஒலி மாதிரி மற்றும் ஒரு குறிவிலக்கி. உள்ளீட்டு ஒலியில் சில எழுத்துக்கள் இருப்பதற்கான நிகழ்தகவைக் கணக்கிட ஒலி மாதிரி ஆழமான இயந்திர கற்றல் நுட்பங்களைப் பயன்படுத்துகிறது.

எழுத்துக்குறி நிகழ்தகவு தரவை உரை பிரதிநிதித்துவமாக மாற்ற டிகோடர் ஒரு கதிர் தேடல் வழிமுறையைப் பயன்படுத்துகிறது. பாரம்பரிய அமைப்புகளை விட டீப்ஸ்பீச் மிகவும் எளிமையானது, அதே நேரத்தில் வெளிப்புற சத்தம் முன்னிலையில் அங்கீகாரத்தின் உயர் தரத்தை வழங்குகிறது.

வளர்ச்சி பாரம்பரிய ஒலி மாதிரிகள் மற்றும் ஃபோன்மேஸின் கருத்தை பயன்படுத்துவதில்லை; அதற்கு பதிலாக, நன்கு உகந்த நரம்பியல் நெட்வொர்க் அடிப்படையிலான இயந்திர கற்றல் அமைப்பு பயன்படுத்தப்படுகிறது, இது சத்தம், எதிரொலி மற்றும் பேச்சு பண்புகள் போன்ற பல்வேறு முரண்பாடுகளை மாதிரியாக உருவாக்க தனித்தனி கூறுகளை உருவாக்கும் தேவையை நீக்குகிறது.

கிட் பயிற்சி பெற்ற மாதிரிகள், மாதிரி ஒலி கோப்புகளை வழங்குகிறது மற்றும் கட்டளை வரி அங்கீகார கருவிகள்.

முடிக்கப்பட்ட மாதிரி ஆங்கிலம் மற்றும் சீன மொழிகளுக்கு மட்டுமே வழங்கப்படுகிறது. பிற மொழிகளுக்கு, பொதுவான குரல் திட்டத்தால் சேகரிக்கப்பட்ட குரல் தரவைப் பயன்படுத்தி, இணைக்கப்பட்ட வழிமுறைகளின்படி கணினியை நீங்களே கற்றுக்கொள்ளலாம்.

போது பதிவிறக்கத்திற்கு வழங்கப்படும் ஆங்கில மொழியின் பயன்படுத்த தயாராக மாதிரி பயன்படுத்தப்படுகிறது, லிப்ரிஸ்பீச் சோதனை தொகுப்பைப் பயன்படுத்தி மதிப்பீடு செய்யும்போது டீப்ஸ்பீச்சில் அங்கீகாரப் பிழைகளின் அளவு 7.06% ஆகும்.

ஒப்பிடுகையில், மனித அங்கீகார பிழை விகிதம் 5,83% என மதிப்பிடப்பட்டுள்ளது.

முன்மொழியப்பட்ட மாதிரியில், வெளிப்புற சத்தங்கள் இல்லாத சூழலில் அமெரிக்க உச்சரிப்புடன் ஆண் குரலை சுத்தமாக பதிவு செய்வதன் மூலம் சிறந்த அங்கீகார முடிவு அடையப்படுகிறது.

வோஸ்க் தொடர்ச்சியான பேச்சு அங்கீகார நூலகத்தின் ஆசிரியரின் கூற்றுப்படி, பொதுவான குரல் தொகுப்பின் தீமைகள் பேச்சுப் பொருளின் ஒருதலைப்பட்சமாகும் (20 முதல் 30 வயதுடைய ஆண்களின் ஆதிக்கம் மற்றும் பெண்கள், குழந்தைகள் மற்றும் குரல்களின் பொருள் இல்லாதது வயதானவர்கள்), சொல்லகராதி மாறுபாட்டின் பற்றாக்குறை (அதே சொற்றொடர்களின் மறுபடியும்) மற்றும் விலகல் ஏற்படக்கூடிய எம்பி 3 பதிவுகளின் விநியோகம்.

டீப்ஸ்பீக்கின் குறைபாடுகள் மோசமான செயல்திறன் அடங்கும் மற்றும் டிகோடரில் அதிக நினைவக நுகர்வு, அதே போல் மாதிரியைப் பயிற்றுவிப்பதற்கான முக்கிய ஆதாரங்களும் (மொஸில்லா 8 குவாட்ரோ ஆர்.டி.எக்ஸ் 6000 ஜி.பீ.யுகள் கொண்ட கணினியைப் பயன்படுத்துகிறது, ஒவ்வொன்றிலும் 24 ஜிபி விஆர்ஏஎம் உள்ளது).

இந்த அணுகுமுறையின் தீங்கு அதுதான் ஒரு நரம்பியல் வலையமைப்பின் உயர்தர அங்கீகாரம் மற்றும் பயிற்சிக்காக, டீப்ஸ்பீக் இயந்திரம் அதிக அளவு தரவு தேவை உண்மையான குரல்களில் வெவ்வேறு குரல்களாலும் இயற்கையான சத்தங்களின் முன்னிலையிலும் கட்டளையிடப்பட்ட பன்முகத்தன்மை.

இந்தத் தரவு மொஸில்லாவில் உருவாக்கப்பட்ட பொதுவான குரல் திட்டத்தால் தொகுக்கப்பட்டுள்ளது, இது ஆங்கிலத்தில் 1469 மணிநேரம், ஜெர்மன் மொழியில் 692, பிரெஞ்சு மொழியில் 554, ரஷ்ய மொழியில் 105 மணிநேரம் மற்றும் உக்ரேனிய மொழியில் 22 மணிநேரங்களுடன் சரிபார்க்கப்பட்ட தரவுத் தொகுப்பை வழங்குகிறது.

டீப்ஸ்பீக்கிற்கான இறுதி ஆங்கில மாதிரியைப் பயிற்றுவிக்கும் போது, ​​பொதுவான குரலுடன் கூடுதலாக, லிப்ரிஸ்பீச், ஃபிஷர் மற்றும் சுவிட்ச்போர்டு திட்டங்களிலிருந்து தரவுகள் கூடுதலாகப் பயன்படுத்தப்படுகின்றன, அத்துடன் டிரான்ஸ்கிரிப்ட் செய்யப்பட்ட வானொலி நிகழ்ச்சிகளின் ஏறக்குறைய 1700 மணிநேர பதிவுகளும் பயன்படுத்தப்படுகின்றன.

புதிய கிளையில் ஏற்படும் மாற்றங்களுக்கு இடையில், சொற்களின் எடையை கட்டாயப்படுத்தும் வாய்ப்பு முன்னிலைப்படுத்தப்பட்டுள்ளது டிகோடிங் செயல்பாட்டின் போது தேர்ந்தெடுக்கப்பட்டது.

எலக்ட்ரான் 9.2 இயங்குதளத்திற்கான ஆதரவு மற்றும் நரம்பியல் வலையமைப்பைப் பயிற்றுவிக்கும் போது அடுக்கு இயல்பாக்குதல் பொறிமுறையின் (அடுக்கு நெறி) விருப்பமான செயல்படுத்தலும் சிறப்பிக்கப்படுகிறது.

பதிவிறக்கம் செய்து பெறுங்கள்

லெபோடாடோ, ராஸ்பெர்ரி பை 3 மற்றும் ராஸ்பெர்ரி பை 4 போர்டுகளிலும், கூகிள் பிக்சல் 2, சோனி எக்ஸ்பீரியா இசட் பிரீமியம் மற்றும் நோக்கியா 1.3 ஸ்மார்ட்போன்களிலும் மோட்டாரைப் பயன்படுத்த செயல்திறன் போதுமானது.

தயாராக தொகுதிகள் வழங்கப்படுகின்றன உங்கள் திட்டங்களில் பேச்சு அங்கீகார செயல்பாடுகளை ஒருங்கிணைக்க பைதான், நோட்ஜெஸ், சி ++ மற்றும் .நெட் ஆகியவற்றிற்குப் பயன்படுத்த (மூன்றாம் தரப்பு டெவலப்பர்கள் ரஸ்ட், கோ மற்றும் வி ஆகியவற்றுக்கு தனித்தனியாக தொகுதிகள் தயார் செய்துள்ளனர்).


உங்கள் கருத்தை தெரிவிக்கவும்

உங்கள் மின்னஞ்சல் முகவரி வெளியிடப்பட்ட முடியாது. தேவையான புலங்கள் குறிக்கப்பட்டிருக்கும் *

*

*

  1. தரவுக்கு பொறுப்பு: மிகுவல் ஏஞ்சல் கேடன்
  2. தரவின் நோக்கம்: கட்டுப்பாட்டு ஸ்பேம், கருத்து மேலாண்மை.
  3. சட்டபூர்வமாக்கல்: உங்கள் ஒப்புதல்
  4. தரவின் தொடர்பு: சட்டபூர்வமான கடமையால் தவிர மூன்றாம் தரப்பினருக்கு தரவு தெரிவிக்கப்படாது.
  5. தரவு சேமிப்பு: ஆக்சென்டஸ் நெட்வொர்க்குகள் (EU) வழங்கிய தரவுத்தளம்
  6. உரிமைகள்: எந்த நேரத்திலும் உங்கள் தகவல்களை நீங்கள் கட்டுப்படுத்தலாம், மீட்டெடுக்கலாம் மற்றும் நீக்கலாம்.