ಮೊಜಿಲ್ಲಾ ಡೀಪ್‌ಸ್ಪೀಚ್ 0.9 ಸ್ಪೀಚ್ ರೆಕಗ್ನಿಷನ್ ಎಂಜಿನ್ ಅನ್ನು ಪರಿಚಯಿಸುತ್ತದೆ

ಡೀಪ್‌ಸ್ಪೀಚ್ 1

ಲಾಂಚ್ ಪ್ರಕಟಿಸಲಾಗಿದೆ ಧ್ವನಿ ಗುರುತಿಸುವಿಕೆ ಎಂಜಿನ್ ಡೀಪ್ ಸ್ಪೀಚ್ 0.9 ಅನ್ನು ಮೊಜಿಲ್ಲಾ ಅಭಿವೃದ್ಧಿಪಡಿಸಿದೆ, ಇದು ವಾಸ್ತುಶಿಲ್ಪವನ್ನು ಕಾರ್ಯಗತಗೊಳಿಸುತ್ತದೆ ಭಾಷಣ ಗುರುತಿಸುವಿಕೆ ಬೈದು ಸಂಶೋಧಕರು ಪ್ರಸ್ತಾಪಿಸಿದ ಅದೇ ಹೆಸರಿನ.

ಅನುಷ್ಠಾನ ಬಳಸಿ ಪೈಥಾನ್‌ನಲ್ಲಿ ಬರೆಯಲಾಗಿದೆ ಯಂತ್ರ ಕಲಿಕೆ ವೇದಿಕೆ ಟೆನ್ಸರ್ಫ್ಲೊ ಮತ್ತು ಉಚಿತ ಎಂಪಿಎಲ್ 2.0 ಪರವಾನಗಿ ಅಡಿಯಲ್ಲಿ ವಿತರಿಸಲಾಗುತ್ತದೆ.

ಡೀಪ್‌ಸ್ಪೀಚ್ ಬಗ್ಗೆ

ಡೀಪ್‌ಸ್ಪೀಚ್ ಎರಡು ಉಪವ್ಯವಸ್ಥೆಗಳನ್ನು ಒಳಗೊಂಡಿದೆ: ಅಕೌಸ್ಟಿಕ್ ಮಾದರಿ ಮತ್ತು ಡಿಕೋಡರ್. ಇನ್ಪುಟ್ ಧ್ವನಿಯಲ್ಲಿ ಕೆಲವು ಅಕ್ಷರಗಳು ಇರುವ ಸಂಭವನೀಯತೆಯನ್ನು ಲೆಕ್ಕಾಚಾರ ಮಾಡಲು ಅಕೌಸ್ಟಿಕ್ ಮಾದರಿಯು ಆಳವಾದ ಯಂತ್ರ ಕಲಿಕೆ ತಂತ್ರಗಳನ್ನು ಬಳಸುತ್ತದೆ.

ಅಕ್ಷರ ಸಂಭವನೀಯತೆ ಡೇಟಾವನ್ನು ಪಠ್ಯ ಪ್ರಾತಿನಿಧ್ಯವಾಗಿ ಪರಿವರ್ತಿಸಲು ಡಿಕೋಡರ್ ಕಿರಣ ಹುಡುಕಾಟ ಅಲ್ಗಾರಿದಮ್ ಅನ್ನು ಬಳಸುತ್ತದೆ. ಡೀಪ್ ಸ್ಪೀಚ್ ಸಾಂಪ್ರದಾಯಿಕ ವ್ಯವಸ್ಥೆಗಳಿಗಿಂತ ಹೆಚ್ಚು ಸರಳವಾಗಿದೆ ಮತ್ತು ಅದೇ ಸಮಯದಲ್ಲಿ ಬಾಹ್ಯ ಶಬ್ದದ ಉಪಸ್ಥಿತಿಯಲ್ಲಿ ಹೆಚ್ಚಿನ ಗುಣಮಟ್ಟದ ಗುರುತಿಸುವಿಕೆಯನ್ನು ಒದಗಿಸುತ್ತದೆ.

ಅಭಿವೃದ್ಧಿಯು ಸಾಂಪ್ರದಾಯಿಕ ಅಕೌಸ್ಟಿಕ್ ಮಾದರಿಗಳನ್ನು ಮತ್ತು ಫೋನ್‌ಮೆಸ್‌ಗಳ ಪರಿಕಲ್ಪನೆಯನ್ನು ಬಳಸುವುದಿಲ್ಲ; ಬದಲಾಗಿ, ಉತ್ತಮವಾದ ಆಪ್ಟಿಮೈಸ್ಡ್ ನ್ಯೂರಾಲ್ ನೆಟ್‌ವರ್ಕ್ ಆಧಾರಿತ ಯಂತ್ರ ಕಲಿಕಾ ವ್ಯವಸ್ಥೆಯನ್ನು ಬಳಸಲಾಗುತ್ತದೆ, ಇದು ಶಬ್ದ, ಪ್ರತಿಧ್ವನಿ ಮತ್ತು ಭಾಷಣ ಗುಣಲಕ್ಷಣಗಳಂತಹ ವಿವಿಧ ವೈಪರೀತ್ಯಗಳನ್ನು ರೂಪಿಸಲು ಪ್ರತ್ಯೇಕ ಘಟಕಗಳನ್ನು ಅಭಿವೃದ್ಧಿಪಡಿಸುವ ಅಗತ್ಯವನ್ನು ನಿವಾರಿಸುತ್ತದೆ.

ಕಿಟ್ ತರಬೇತಿ ಪಡೆದ ಮಾದರಿಗಳು, ಮಾದರಿ ಧ್ವನಿ ಫೈಲ್‌ಗಳನ್ನು ನೀಡುತ್ತದೆ ಮತ್ತು ಆಜ್ಞಾ ಸಾಲಿನ ಗುರುತಿಸುವಿಕೆ ಸಾಧನಗಳು.

ಸಿದ್ಧಪಡಿಸಿದ ಮಾದರಿಯನ್ನು ಇಂಗ್ಲಿಷ್ ಮತ್ತು ಚೈನೀಸ್ ಭಾಷೆಗಳಿಗೆ ಮಾತ್ರ ಸರಬರಾಜು ಮಾಡಲಾಗುತ್ತದೆ. ಇತರ ಭಾಷೆಗಳಿಗಾಗಿ, ಸಾಮಾನ್ಯ ಧ್ವನಿ ಯೋಜನೆಯಿಂದ ಸಂಗ್ರಹಿಸಲಾದ ಧ್ವನಿ ಡೇಟಾವನ್ನು ಬಳಸಿಕೊಂಡು ಲಗತ್ತಿಸಲಾದ ಸೂಚನೆಗಳ ಪ್ರಕಾರ ವ್ಯವಸ್ಥೆಯನ್ನು ನೀವೇ ಕಲಿಯಬಹುದು.

ಯಾವಾಗ ಡೌನ್‌ಲೋಡ್‌ಗಾಗಿ ನೀಡಲಾಗುವ ಇಂಗ್ಲಿಷ್ ಭಾಷೆಯ ಸಿದ್ಧ ಮಾದರಿಯನ್ನು ಬಳಸಲಾಗುತ್ತದೆ, ಲಿಬ್ರಿಸ್ಪೀಚ್ ಪರೀಕ್ಷಾ ಸೂಟ್ ಬಳಸಿ ಮೌಲ್ಯಮಾಪನ ಮಾಡುವಾಗ ಡೀಪ್‌ಸ್ಪೀಚ್‌ನಲ್ಲಿನ ಗುರುತಿಸುವಿಕೆ ದೋಷಗಳ ಮಟ್ಟ 7.06% ಆಗಿದೆ.

ಹೋಲಿಕೆಗಾಗಿ, ಮಾನವ ಗುರುತಿಸುವಿಕೆ ದೋಷ ದರವನ್ನು 5,83% ಎಂದು ಅಂದಾಜಿಸಲಾಗಿದೆ.

ಪ್ರಸ್ತಾವಿತ ಮಾದರಿಯಲ್ಲಿ, ಹೊರಗಿನ ಶಬ್ದಗಳಿಲ್ಲದ ಪರಿಸರದಲ್ಲಿ ಅಮೇರಿಕನ್ ಉಚ್ಚಾರಣೆಯೊಂದಿಗೆ ಪುರುಷ ಧ್ವನಿಯನ್ನು ಸ್ವಚ್ record ವಾಗಿ ರೆಕಾರ್ಡಿಂಗ್ ಮಾಡುವ ಮೂಲಕ ಉತ್ತಮ ಗುರುತಿಸುವಿಕೆ ಫಲಿತಾಂಶವನ್ನು ಸಾಧಿಸಲಾಗುತ್ತದೆ.

ವೋಸ್ಕ್ ಕಂಟಿನ್ಯೂಸ್ ಸ್ಪೀಚ್ ರೆಕಗ್ನಿಷನ್ ಲೈಬ್ರರಿಯ ಲೇಖಕರ ಪ್ರಕಾರ, ಸಾಮಾನ್ಯ ಧ್ವನಿ ಗುಂಪಿನ ಅನಾನುಕೂಲಗಳು ಭಾಷಣ ವಸ್ತುಗಳ ಏಕಪಕ್ಷೀಯತೆ (20 ರಿಂದ 30 ವರ್ಷ ವಯಸ್ಸಿನ ಪುರುಷರ ಪ್ರಾಬಲ್ಯ ಮತ್ತು ಮಹಿಳೆಯರು, ಮಕ್ಕಳು ಮತ್ತು ಅವರ ಧ್ವನಿಯೊಂದಿಗೆ ವಸ್ತುಗಳ ಕೊರತೆ ಹಿರಿಯರು), ಶಬ್ದಕೋಶದ ವ್ಯತ್ಯಾಸದ ಕೊರತೆ (ಅದೇ ನುಡಿಗಟ್ಟುಗಳ ಪುನರಾವರ್ತನೆ) ಮತ್ತು ಅಸ್ಪಷ್ಟತೆಗೆ ಒಳಗಾಗುವ ಎಂಪಿ 3 ರೆಕಾರ್ಡಿಂಗ್‌ಗಳ ವಿತರಣೆ.

ಡೀಪ್‌ಸ್ಪೀಚ್‌ನ ಅನಾನುಕೂಲಗಳು ಕಳಪೆ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಒಳಗೊಂಡಿವೆ ಮತ್ತು ಡಿಕೋಡರ್ನಲ್ಲಿ ಹೆಚ್ಚಿನ ಮೆಮೊರಿ ಬಳಕೆ, ಮತ್ತು ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡಲು ಪ್ರಮುಖ ಸಂಪನ್ಮೂಲಗಳು (ಮೊಜಿಲ್ಲಾ 8 ಕ್ವಾಡ್ರೊ ಆರ್ಟಿಎಕ್ಸ್ 6000 ಜಿಪಿಯುಗಳೊಂದಿಗೆ 24 ಜಿಬಿ ವಿಆರ್ಎಎಂ ಹೊಂದಿರುವ ವ್ಯವಸ್ಥೆಯನ್ನು ಬಳಸುತ್ತದೆ).

ಈ ವಿಧಾನದ ತೊಂದರೆಯೆಂದರೆ ಅದು ನರಮಂಡಲದ ಉತ್ತಮ-ಗುಣಮಟ್ಟದ ಗುರುತಿಸುವಿಕೆ ಮತ್ತು ತರಬೇತಿಗಾಗಿ, ಡೀಪ್‌ಸ್ಪೀಚ್ ಎಂಜಿನ್ ಹೆಚ್ಚಿನ ಪ್ರಮಾಣದ ಡೇಟಾ ಅಗತ್ಯವಿದೆ ವಿಭಿನ್ನ ಪರಿಸ್ಥಿತಿಗಳಿಂದ ಮತ್ತು ನೈಸರ್ಗಿಕ ಶಬ್ದಗಳ ಉಪಸ್ಥಿತಿಯಲ್ಲಿ ನೈಜ ಪರಿಸ್ಥಿತಿಗಳಲ್ಲಿ ನಿರ್ದೇಶಿಸಲಾದ ಭಿನ್ನಜಾತಿ.

ಮೊಜಿಲ್ಲಾದಲ್ಲಿ ರಚಿಸಲಾದ ಕಾಮನ್ ವಾಯ್ಸ್ ಪ್ರಾಜೆಕ್ಟ್ ಈ ಡೇಟಾವನ್ನು ಸಂಗ್ರಹಿಸಿದೆ, ಇದು ಇಂಗ್ಲಿಷ್ನಲ್ಲಿ 1469 ಗಂಟೆಗಳು, ಜರ್ಮನ್ ಭಾಷೆಯಲ್ಲಿ 692, ಫ್ರೆಂಚ್ನಲ್ಲಿ 554, ರಷ್ಯನ್ ಭಾಷೆಯಲ್ಲಿ 105 ಗಂಟೆಗಳು ಮತ್ತು ಉಕ್ರೇನಿಯನ್ ಭಾಷೆಯಲ್ಲಿ 22 ಗಂಟೆಗಳೊಂದಿಗೆ ಪರಿಶೀಲಿಸಿದ ಡೇಟಾವನ್ನು ಒದಗಿಸುತ್ತದೆ.

ಡೀಪ್ ಸ್ಪೀಚ್ಗಾಗಿ ಅಂತಿಮ ಇಂಗ್ಲಿಷ್ ಮಾದರಿಯನ್ನು ತರಬೇತಿ ಮಾಡುವಾಗ, ಕಾಮನ್ ವಾಯ್ಸ್ ಜೊತೆಗೆ, ಲಿಬ್ರಿಸ್ಪೀಚ್, ಫಿಶರ್ ಮತ್ತು ಸ್ವಿಚ್ಬೋರ್ಡ್ ಯೋಜನೆಗಳ ಡೇಟಾವನ್ನು ಹೆಚ್ಚುವರಿಯಾಗಿ ಬಳಸಲಾಗುತ್ತದೆ, ಜೊತೆಗೆ ಸರಿಸುಮಾರು 1700 ಗಂಟೆಗಳ ಪ್ರತಿಲೇಖಿತ ರೇಡಿಯೋ ಪ್ರೋಗ್ರಾಂ ರೆಕಾರ್ಡಿಂಗ್‌ಗಳನ್ನು ಬಳಸಲಾಗುತ್ತದೆ.

ಹೊಸ ಶಾಖೆಯಲ್ಲಿನ ಬದಲಾವಣೆಗಳ ನಡುವೆ, ಪದಗಳ ತೂಕವನ್ನು ಒತ್ತಾಯಿಸುವ ಸಾಧ್ಯತೆಯನ್ನು ಎತ್ತಿ ತೋರಿಸಲಾಗಿದೆ ಡಿಕೋಡಿಂಗ್ ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ ಆಯ್ಕೆ ಮಾಡಲಾಗಿದೆ.

ಇದು ಎಲೆಕ್ಟ್ರಾನ್ 9.2 ಪ್ಲಾಟ್‌ಫಾರ್ಮ್‌ಗೆ ಬೆಂಬಲವನ್ನು ನೀಡುತ್ತದೆ ಮತ್ತು ನರಮಂಡಲವನ್ನು ತರಬೇತಿ ಮಾಡುವಾಗ ಲೇಯರ್ ನಾರ್ಮಲೈಸೇಶನ್ ಮೆಕ್ಯಾನಿಸಮ್ (ಲೇಯರ್ ನಾರ್ಮ್) ನ ಐಚ್ al ಿಕ ಅನುಷ್ಠಾನವನ್ನು ತೋರಿಸುತ್ತದೆ.

ಡೌನ್‌ಲೋಡ್ ಮಾಡಿ ಮತ್ತು ಪಡೆಯಿರಿ

ಲೆಪೋಟಾಟೊ, ರಾಸ್‌ಪ್ಬೆರಿ ಪೈ 3 ಮತ್ತು ರಾಸ್‌ಪ್ಬೆರಿ ಪೈ 4 ಬೋರ್ಡ್‌ಗಳಲ್ಲಿ ಹಾಗೂ ಗೂಗಲ್ ಪಿಕ್ಸೆಲ್ 2, ಸೋನಿ ಎಕ್ಸ್‌ಪೀರಿಯಾ Z ಡ್ ಪ್ರೀಮಿಯಂ ಮತ್ತು ನೋಕಿಯಾ 1.3 ಸ್ಮಾರ್ಟ್‌ಫೋನ್‌ಗಳಲ್ಲಿ ಮೋಟರ್ ಅನ್ನು ಬಳಸಲು ಕಾರ್ಯಕ್ಷಮತೆ ಸಾಕಾಗುತ್ತದೆ.

ಸಿದ್ಧ ಮಾಡ್ಯೂಲ್‌ಗಳನ್ನು ನೀಡಲಾಗುತ್ತದೆ ನಿಮ್ಮ ಕಾರ್ಯಕ್ರಮಗಳಲ್ಲಿ ಭಾಷಣ ಗುರುತಿಸುವಿಕೆ ಕಾರ್ಯಗಳನ್ನು ಸಂಯೋಜಿಸಲು ಪೈಥಾನ್, ನೋಡ್ಜೆಎಸ್, ಸಿ ++ ಮತ್ತು .ನೆಟ್ಗಾಗಿ ಬಳಸಲು (ಮೂರನೇ ವ್ಯಕ್ತಿಯ ಅಭಿವರ್ಧಕರು ರಸ್ಟ್, ಗೋ ಮತ್ತು ವಿಗಾಗಿ ಪ್ರತ್ಯೇಕವಾಗಿ ಮಾಡ್ಯೂಲ್‌ಗಳನ್ನು ಸಿದ್ಧಪಡಿಸಿದ್ದಾರೆ).


ನಿಮ್ಮ ಅಭಿಪ್ರಾಯವನ್ನು ಬಿಡಿ

ನಿಮ್ಮ ಈಮೇಲ್ ವಿಳಾಸ ಪ್ರಕಟವಾದ ಆಗುವುದಿಲ್ಲ. ಅಗತ್ಯವಿರುವ ಜಾಗ ಗುರುತಿಸಲಾಗಿದೆ *

*

*

  1. ಡೇಟಾಗೆ ಜವಾಬ್ದಾರಿ: ಮಿಗುಯೆಲ್ ಏಂಜೆಲ್ ಗಟಾನ್
  2. ಡೇಟಾದ ಉದ್ದೇಶ: ನಿಯಂತ್ರಣ SPAM, ಕಾಮೆಂಟ್ ನಿರ್ವಹಣೆ.
  3. ಕಾನೂನುಬದ್ಧತೆ: ನಿಮ್ಮ ಒಪ್ಪಿಗೆ
  4. ಡೇಟಾದ ಸಂವಹನ: ಕಾನೂನುಬದ್ಧ ಬಾಧ್ಯತೆಯನ್ನು ಹೊರತುಪಡಿಸಿ ಡೇಟಾವನ್ನು ಮೂರನೇ ವ್ಯಕ್ತಿಗಳಿಗೆ ಸಂವಹನ ಮಾಡಲಾಗುವುದಿಲ್ಲ.
  5. ಡೇಟಾ ಸಂಗ್ರಹಣೆ: ಆಕ್ಸೆಂಟಸ್ ನೆಟ್‌ವರ್ಕ್‌ಗಳು (ಇಯು) ಹೋಸ್ಟ್ ಮಾಡಿದ ಡೇಟಾಬೇಸ್
  6. ಹಕ್ಕುಗಳು: ಯಾವುದೇ ಸಮಯದಲ್ಲಿ ನೀವು ನಿಮ್ಮ ಮಾಹಿತಿಯನ್ನು ಮಿತಿಗೊಳಿಸಬಹುದು, ಮರುಪಡೆಯಬಹುದು ಮತ್ತು ಅಳಿಸಬಹುದು.