ගූගල් විසින් ලයිරා හි V2, අඩු-බිට්රේට් විවෘත කේත කෝඩෙක් නිකුත් කරන ලදී

ලයිරා ගූගල් ඕඩියෝ කෝඩෙක්

Google විසින් Lyra හි දෙවන අනුවාදය නිකුත් කරන ලදී, එහි උසස් තත්ත්වයේ, අඩු-bitrate codec එය මන්දගාමී ජාලවල පවා හඬ සන්නිවේදනය ලබා ගත හැකිය.

මෑතකදී ගූගල් බ්ලොග් සටහනක් හරහා එළිදක්වන ලදී, ඔබගේ ශ්‍රව්‍ය කෝඩෙක්හි දෙවන අනුවාදය නිකුත් කිරීම "Lyra-V2", ඉතා මන්දගාමී සන්නිවේදන නාලිකා භාවිතා කරන විට ඉහළම හඬ ගුණාත්මක භාවය ලබා ගැනීම සඳහා යන්ත්‍ර ඉගෙනුම් ශිල්පීය ක්‍රම භාවිතා කරයි.

නව අනුවාදය නව ස්නායුක ජාල ගෘහ නිර්මාණ ශිල්පයකට සංක්‍රමණයක් හඳුන්වා දෙයි, අමතර වේදිකා සඳහා සහය, වැඩි දියුණු කළ බිට්‍රේට් පාලනය, කාර්ය සාධනය වැඩි දියුණු කිරීම් සහ ඉහළ ශ්‍රව්‍ය ගුණාත්මක භාවය.

අපි දැන් Lyra V2 නිකුත් කරන්නෙමු, පුළුල් වේදිකා සහාය භුක්ති විඳින, පරිමාණය කළ හැකි bitrate හැකියාවන්, වඩා හොඳ කාර්ය සාධනයක් සහ උසස් තත්ත්වයේ ශ්‍රව්‍ය සපයන නව ගෘහ නිර්මාණ ශිල්පයක් සමඟින්. මෙම නිකුතුව සමඟින්, අපි ප්‍රජාව සමඟ අඛණ්ඩව පරිණාමය වීමට බලාපොරොත්තු වන අතර, ඔබේ සාමූහික නිර්මාණශීලිත්වය සමඟින්, නව යෙදුම් සංවර්ධනය වෙමින් සහ නව දිශාවන් මතුවීම දැකීමට අපි බලාපොරොත්තු වෙමු.

ලයිරා ගැන

අඩු වේගයකින් සම්ප්‍රේෂණය වන හඬ දත්තවල ගුණාත්මකභාවය සම්බන්ධයෙන්, ලයිරා සාම්ප්රදායික කෝඩෙක්ස් වලට වඩා සැලකිය යුතු ලෙස උසස් ය ඩිජිටල් සංඥා සැකසුම් ක්රම භාවිතා කරන බව. සාමාන්‍ය ශ්‍රව්‍ය සම්පීඩන සහ සංඥා පරිවර්තන ක්‍රමවලට අමතරව සීමිත සම්ප්‍රේෂණ තොරතුරු ප්‍රමාණයක කොන්දේසි යටතේ උසස් තත්ත්වයේ හඬ සම්ප්‍රේෂණය සාක්ෂාත් කර ගැනීම සඳහා, ලයිරා යන්ත්‍ර ඉගෙනුම් පද්ධතියක් මත පදනම් වූ හඬ ආකෘතියක් භාවිතා කරයි නැතිවූ තොරතුරු නැවත නිර්මාණය කිරීමට ඔබට ඉඩ සලසයි. සාමාන්ය කථන ලක්ෂණ මත පදනම්ව.

කෝඩෙක්ට එන්කෝඩරයක් සහ විකේතකයක් ඇතුළත් වේ. කේතීකරණ ඇල්ගොරිතම සෑම මිලි තත්පර 20 කට වරක් හඬ දත්ත පරාමිති උපුටා ගෙන ඒවා සම්පීඩනය කර ලබන්නා වෙත මාරු කරයි 3,2 kbps සිට 9,2 kbps දක්වා බිට් අනුපාතයක් සමඟ ජාලය හරහා.

ග්‍රාහක පැත්තේ, විවිධ සංඛ්‍යාත පරාසයන්හි කථනයේ ශක්ති ලක්ෂණ සැලකිල්ලට ගන්නා ලඝුගණක හුණු වර්ණාවලීක්ෂ ඇතුළුව සම්ප්‍රේෂණය කරන ලද ශ්‍රව්‍ය පරාමිතීන් මත පදනම්ව මුල් කථන සංඥාව ප්‍රතිනිර්මාණය කිරීමට විකේතකය උත්පාදක ආකෘතියක් භාවිතා කරයි. .

Lyra V2 හි අලුත් මොනවාද?

Lyra V2 SoundStream ස්නායු ජාලය මත පදනම් වූ නව උත්පාදක ආකෘතියක් භාවිතා කරයි, අඩු පරිගණක අවශ්‍යතා ඇති, අඩු බල පද්ධතිවල පවා තත්‍ය කාලීන විකේතනය කිරීමට ඉඩ සලසයි.

ශබ්දය ජනනය කිරීමට භාවිතා කරන ආකෘතිය භාෂා 90 කට වඩා වැඩි ගණනකින් පැය දහස් ගණනක හඬ පටිගත කිරීම් භාවිතා කරමින් පුහුණු කර ඇත (TensorFlow Lite ආකෘතිය ධාවනය කිරීමට භාවිතා කරයි) යෝජිත ක්රියාත්මක කිරීමේ කාර්ය සාධනය අඩුම මිල පරාසයේ ස්මාර්ට්ෆෝන් මත හඬ සංකේතනය කිරීමට සහ විකේතනය කිරීමට ප්රමාණවත් වේ.

වෙනස් ජනක ආකෘතියක් භාවිතා කිරීමට අමතරව, නව අනුවාදය RVQ quantifier සමඟ සබැඳි ඇතුළත් කිරීම සඳහා ද කැපී පෙනේ (Residual Vector Quantizer) දත්ත සම්ප්‍රේෂණයට පෙර යවන්නාගේ පැත්තේ සහ දත්ත ලැබීමෙන් පසු ග්‍රාහකයාගේ පැත්තෙන් සිදු කරනු ලබන කෝඩෙක් ගෘහ නිර්මාණ ශිල්පයේ.

Quantizer විසින් codec මඟින් සපයන ලද පරාමිති පැකට් කට්ටල බවට පරිවර්තනය කරයි, තෝරාගත් බිටු අනුපාතයට සාපේක්ෂව තොරතුරු කේතනය කරයි. විවිධ තත්ත්ව මට්ටම් සහතික කිරීම සඳහා, බිට්රේට් තුනක් (3,2kbps, 6kbps, සහ 9,2kbps) සඳහා ක්වොන්ටයිසර් සපයනු ලැබේ, බිට්රේට් වැඩි වන තරමට ගුණාත්මකභාවය වඩා හොඳය, නමුත් කලාප පළල අවශ්‍යතා වැඩි වේ.

නව ගෘහ නිර්මාණ ශිල්පය සංඥා සම්ප්‍රේෂණ ප්‍රමාදය මිලි තත්පර 100 සිට මිලි තත්පර 20 දක්වා අඩු කර ඇත. සංසන්දනය කිරීම සඳහා, WebRTC සඳහා Opus codec පරීක්‍ෂා කරන ලද බිට් අනුපාතවල දී 26,5 ms, 46,5 ms සහ 66,5 ms ප්‍රමාදයන් පෙන්නුම් කළේය. එන්කෝඩර් සහ විකේතක ක්‍රියාකාරිත්වය ද සැලකිය යුතු ලෙස වැඩි වී ඇත: පෙර අනුවාදය හා සසඳන විට, 5 ගුණයක් දක්වා ත්වරණයක් ඇත. උදාහරණයක් ලෙස, Pixel 6 Pro ස්මාර්ට් ජංගම දුරකතනයේ, නව කෝඩෙක් 20ms නියැදියක් 0,57ms වලින් සංකේතනය කර විකේතනය කරයි, එය තත්‍ය කාලීන ප්‍රවාහය සඳහා අවශ්‍ය ප්‍රමාණයට වඩා 35 ගුණයකින් වේගවත් වේ.

කාර්ය සාධනයට අමතරව, ශබ්ද ප්‍රතිසාධනයේ ගුණාත්මකභාවය වැඩි දියුණු කිරීමට ද අපි සමත් විය: MUSHRA පරිමාණයට අනුව, Lyra V3,2 කෝඩෙක් භාවිතා කරන විට 6 kbps, 9,2 kbps සහ 2 kbps බිට් අනුපාතයකින් කථනයේ ගුණාත්මකභාවය 10 kbps බිට් අනුපාතවලට අනුරූප වේ, Opus codec භාවිතා කරන විට 13 kbps සහ 14 kbps.

අවසානයේ ඔබ ඒ ගැන වැඩි විස්තර දැන ගැනීමට කැමති නම්, ඔබට විස්තර පරීක්ෂා කළ හැකිය පහත සබැඳිය.


ලිපියේ අන්තර්ගතය අපගේ මූලධර්මවලට අනුකූල වේ කතුවැකි ආචාර ධර්ම. දෝෂයක් වාර්තා කිරීමට ක්ලික් කරන්න මෙන්න.

අදහස් පළ කිරීමට ප්රථම වන්න

ඔබේ අදහස තබන්න

ඔබේ ඊ-මේල් ලිපිනය පළ කරනු නොලැබේ. අවශ්ය ක්ෂේත්ර දක්වා ඇති ලකුණ *

*

*

  1. දත්ත සඳහා වගකිව යුතු: මිගෙල් ඇන්ජල් ගැටන්
  2. දත්තවල අරමුණ: SPAM පාලනය කිරීම, අදහස් කළමනාකරණය.
  3. නීත්‍යානුකූලභාවය: ඔබේ කැමැත්ත
  4. දත්ත සන්නිවේදනය: නෛතික බැඳීමකින් හැර දත්ත තෙවන පාර්ශවයකට සන්නිවේදනය නොකෙරේ.
  5. දත්ත ගබඩා කිරීම: ඔක්සෙන්ටස් නෙට්වර්ක්ස් (EU) විසින් සත්කාරකත්වය දක්වන දත්ත සමුදාය
  6. අයිතිවාසිකම්: ඕනෑම වේලාවක ඔබට ඔබේ තොරතුරු සීමා කිරීමට, නැවත ලබා ගැනීමට සහ මකා දැමීමට හැකිය.