Google એ Lyra નું V2 રિલીઝ કર્યું, જે લો-બિટરેટ ઓપન સોર્સ કોડેક છે

Lyra Google ઓડિયો કોડેક

Google એ Lyra નું બીજું સંસ્કરણ બહાર પાડ્યું, તેનું ઉચ્ચ-ગુણવત્તાવાળા, ઓછા-બિટરેટ કોડેક કે જે સૌથી ધીમા નેટવર્ક પર પણ વૉઇસ કમ્યુનિકેશન ઉપલબ્ધ કરાવે છે.

તાજેતરમાં ગૂગલે એક બ્લોગ પોસ્ટ દ્વારા અનાવરણ કર્યું, તમારા ઓડિયો કોડેકનું બીજું સંસ્કરણ બહાર પાડી રહ્યું છે "Lyra-V2", જે ખૂબ જ ધીમી કોમ્યુનિકેશન ચેનલોનો ઉપયોગ કરતી વખતે ઉચ્ચતમ અવાજની ગુણવત્તા પ્રાપ્ત કરવા માટે મશીન લર્નિંગ તકનીકોનો ઉપયોગ કરે છે.

નવું સંસ્કરણ નવા ન્યુરલ નેટવર્ક આર્કિટેક્ચરમાં સંક્રમણ રજૂ કરે છે, વધારાના પ્લેટફોર્મ, સુધારેલ બિટરેટ નિયંત્રણ, પ્રદર્શન સુધારણા અને ઉચ્ચ ઑડિયો ગુણવત્તા માટે સપોર્ટ.

અમે હવે Lyra V2 રિલીઝ કરી રહ્યા છીએ, એક નવા આર્કિટેક્ચર સાથે જે વ્યાપક પ્લેટફોર્મ સપોર્ટનો આનંદ માણે છે, સ્કેલેબલ બિટરેટ ક્ષમતાઓ, બહેતર પ્રદર્શન અને ઉચ્ચ ગુણવત્તાની ઑડિયો પ્રદાન કરે છે. આ પ્રકાશન સાથે, અમે સમુદાય સાથે વિકાસ કરવાનું ચાલુ રાખવાની અને તમારી સામૂહિક સર્જનાત્મકતા સાથે, નવી એપ્લિકેશનો વિકસિત થતી અને નવી દિશાઓ ઉભરતી જોવાની આશા રાખીએ છીએ.

લિરા વિશે

ઓછી ઝડપે પ્રસારિત થતા વૉઇસ ડેટાની ગુણવત્તા અંગે, લિરા પરંપરાગત કોડેક કરતાં નોંધપાત્ર રીતે શ્રેષ્ઠ છે જે ડિજિટલ સિગ્નલ પ્રોસેસિંગ પદ્ધતિઓનો ઉપયોગ કરે છે. સામાન્ય ઑડિઓ કમ્પ્રેશન અને સિગ્નલ કન્વર્ઝન પદ્ધતિઓ ઉપરાંત, મર્યાદિત માત્રામાં પ્રસારિત માહિતીની શરતો હેઠળ ઉચ્ચ-ગુણવત્તાવાળા વૉઇસ ટ્રાન્સમિશન પ્રાપ્ત કરવા માટે, Lyra મશીન લર્નિંગ સિસ્ટમ પર આધારિત વૉઇસ મૉડલનો ઉપયોગ કરે છે જે તમને ગુમ થયેલ માહિતીને ફરીથી બનાવવા માટે પરવાનગી આપે છે. લાક્ષણિક ભાષણ લાક્ષણિકતાઓ પર આધારિત.

કોડેકમાં એન્કોડર અને ડીકોડરનો સમાવેશ થાય છે. એન્કોડર અલ્ગોરિધમ દર 20 મિલીસેકન્ડે વૉઇસ ડેટા પેરામીટર્સ બહાર કાઢે છે, તેમને સંકુચિત કરે છે અને પ્રાપ્તકર્તાને સ્થાનાંતરિત કરે છે 3,2 kbps થી 9,2 kbps ના બીટ રેટ સાથે નેટવર્ક પર.

રીસીવર બાજુએ, ડીકોડર ટ્રાન્સમિટેડ ઓડિયો પેરામીટર્સ પર આધારિત મૂળ સ્પીચ સિગ્નલને ફરીથી બનાવવા માટે જનરેટિવ મોડલનો ઉપયોગ કરે છે, જેમાં લોગરિધમિક ચાક સ્પેક્ટ્રોગ્રામનો સમાવેશ થાય છે જે વિવિધ ફ્રીક્વન્સી રેન્જમાં વાણીની ઉર્જા લાક્ષણિકતાઓને ધ્યાનમાં લે છે. અને માનવ શ્રાવ્ય ધારણાને ધ્યાનમાં રાખીને તૈયાર કરવામાં આવે છે. .

Lyra V2 માં નવું શું છે?

Lyra V2 સાઉન્ડસ્ટ્રીમ ન્યુરલ નેટવર્ક પર આધારિત નવા જનરેટિવ મોડલનો ઉપયોગ કરે છે, જે ઓછી કોમ્પ્યુટેશનલ આવશ્યકતાઓ ધરાવે છે, જે લો-પાવર સિસ્ટમ્સ પર પણ રીઅલ-ટાઇમ ડીકોડિંગને મંજૂરી આપે છે.

અવાજ ઉત્પન્ન કરવા માટે ઉપયોગમાં લેવાતા મોડેલને 90 થી વધુ ભાષાઓમાં કેટલાક હજાર કલાકના વૉઇસ રેકોર્ડિંગનો ઉપયોગ કરીને તાલીમ આપવામાં આવી છે (ટેન્સરફ્લો લાઇટનો ઉપયોગ મોડેલ ચલાવવા માટે થાય છે). સૂચિત અમલીકરણનું પ્રદર્શન સૌથી નીચી કિંમત શ્રેણીના સ્માર્ટફોન્સ પર અવાજને એન્કોડ કરવા અને ડીકોડ કરવા માટે પૂરતું છે.

અલગ જનરેટિવ મોડલનો ઉપયોગ કરવા ઉપરાંત, નવી આવૃત્તિ RVQ ક્વોન્ટિફાયર સાથેની લિંક્સના સમાવેશ માટે પણ અલગ છે કોડેક આર્કિટેક્ચરમાં (શેષ વેક્ટર ક્વોન્ટાઈઝર), જે ડેટા ટ્રાન્સમિશન પહેલા પ્રેષક બાજુ પર અને ડેટા રિસેપ્શન પછી રીસીવર બાજુ પર કરવામાં આવે છે.

ક્વોન્ટાઈઝર કોડેક દ્વારા પૂરા પાડવામાં આવેલ પરિમાણોને પેકેટના સેટમાં રૂપાંતરિત કરે છે, પસંદ કરેલ બીટ રેટને સંબંધિત માહિતીને એન્કોડિંગ કરે છે. વિવિધ ગુણવત્તાના સ્તરો સુનિશ્ચિત કરવા માટે, ત્રણ બિટરેટ (3,2kbps, 6kbps અને 9,2kbps) માટે ક્વોન્ટાઈઝર પ્રદાન કરવામાં આવે છે, બિટરેટ જેટલો ઊંચો છે, તેટલી સારી ગુણવત્તા, પરંતુ બેન્ડવિડ્થની જરૂરિયાતો જેટલી વધારે છે.

નવી આર્કિટેક્ચર સિગ્નલ ટ્રાન્સમિશન વિલંબને 100 મિલીસેકન્ડથી ઘટાડીને 20 મિલીસેકન્ડ કર્યો છે. સરખામણી માટે, WebRTC માટે ઓપસ કોડેક પરીક્ષણ કરાયેલ બીટ દરો પર 26,5 ms, 46,5 ms અને 66,5 ms નો વિલંબ દર્શાવે છે. એન્કોડર અને ડીકોડર કામગીરી પણ નોંધપાત્ર રીતે વધી છે: પાછલા સંસ્કરણની તુલનામાં, 5 ગણા સુધીનો પ્રવેગ છે. ઉદાહરણ તરીકે, Pixel 6 Pro સ્માર્ટફોન પર, નવો કોડેક 20ms સેમ્પલને 0,57ms માં એન્કોડ કરે છે અને ડીકોડ કરે છે, જે રીઅલ-ટાઇમ સ્ટ્રીમિંગ માટે જરૂરી કરતાં 35 ગણો ઝડપી છે.

પ્રદર્શન ઉપરાંત, અમે ધ્વનિ પુનઃસ્થાપનની ગુણવત્તાને સુધારવામાં પણ વ્યવસ્થાપિત છીએ: MUSHRA સ્કેલ મુજબ, Lyra V3,2 કોડેકનો ઉપયોગ કરતી વખતે 6 kbps, 9,2 kbps અને 2 kbps ના બીટ રેટ પર સ્પીચ ક્વોલિટી 10 kbps ના બીટ રેટને અનુરૂપ છે, ઓપસ કોડેકનો ઉપયોગ કરતી વખતે 13 kbps અને 14 kbps.

છેલ્લે જો તમને તેના વિશે વધુ જાણવામાં રસ છે, તમે તેમાં વિગતો ચકાસી શકો છો નીચેની કડી.


તમારી ટિપ્પણી મૂકો

તમારું ઇમેઇલ સરનામું પ્રકાશિત કરવામાં આવશે નહીં. આવશ્યક ક્ષેત્રો સાથે ચિહ્નિત થયેલ છે *

*

*

  1. ડેટા માટે જવાબદાર: મિગ્યુએલ gelંજેલ ગેટóન
  2. ડેટાનો હેતુ: નિયંત્રણ સ્પામ, ટિપ્પણી સંચાલન.
  3. કાયદો: તમારી સંમતિ
  4. ડેટાની વાતચીત: કાયદાકીય જવાબદારી સિવાય ડેટા તૃતીય પક્ષને આપવામાં આવશે નહીં.
  5. ડેટા સ્ટોરેજ: cસેન્ટસ નેટવર્ક્સ (ઇયુ) દ્વારા હોસ્ટ કરેલો ડેટાબેઝ
  6. અધિકાર: કોઈપણ સમયે તમે તમારી માહિતીને મર્યાદિત, પુન recoverપ્રાપ્ત અને કા deleteી શકો છો.