Google ने Lyra चे V2, लो-बिटरेट ओपन सोर्स कोडेक जारी केले

Lyra Google ऑडिओ कोडेक

Google ने Lyra ची दुसरी आवृत्ती जारी केली, त्याचे उच्च-गुणवत्तेचे, कमी-बिटरेट कोडेक जे अगदी धीमे नेटवर्कवरही व्हॉइस कम्युनिकेशन उपलब्ध करते.

अलीकडे Google ने ब्लॉग पोस्टद्वारे अनावरण केले, तुमच्या ऑडिओ कोडेकची दुसरी आवृत्ती रिलीझ करत आहे "Lyra-V2", जे अतिशय संथ संप्रेषण चॅनेल वापरताना उच्च आवाज गुणवत्ता प्राप्त करण्यासाठी मशीन लर्निंग तंत्र वापरते.

नवीन आवृत्ती नवीन न्यूरल नेटवर्क आर्किटेक्चरमध्ये संक्रमण सादर करते, अतिरिक्त प्लॅटफॉर्मसाठी समर्थन, सुधारित बिटरेट नियंत्रण, कार्यप्रदर्शन सुधारणा आणि उच्च ऑडिओ गुणवत्ता.

आम्‍ही आता Lyra V2 रिलीझ करत आहोत, एका नवीन आर्किटेक्चरसह जे व्‍यापक प्‍लॅटफॉर्म सपोर्टचा आनंद घेते, स्केलेबल बिटरेट क्षमता, चांगली कामगिरी आणि उच्च दर्जाचा ऑडिओ प्रदान करते. या प्रकाशनासह, आम्ही समुदायासोबत उत्क्रांत होण्यासाठी आणि तुमच्या सामूहिक सर्जनशीलतेसह, नवीन अनुप्रयोग विकसित होताना आणि नवीन दिशानिर्देश उदयास येण्याची अपेक्षा करतो.

लिरा बद्दल

कमी वेगाने प्रसारित व्हॉइस डेटाच्या गुणवत्तेबाबत, लिरा पारंपारिक कोडेक्सपेक्षा लक्षणीय श्रेष्ठ आहे जे डिजिटल सिग्नल प्रोसेसिंग पद्धती वापरतात. नेहमीच्या ऑडिओ कॉम्प्रेशन आणि सिग्नल रूपांतरण पद्धतींव्यतिरिक्त, मर्यादित प्रमाणात प्रसारित माहितीच्या परिस्थितीत उच्च-गुणवत्तेचे व्हॉइस ट्रांसमिशन प्राप्त करण्यासाठी, Lyra मशीन लर्निंग सिस्टमवर आधारित व्हॉइस मॉडेल वापरते जे तुम्हाला गहाळ माहिती पुन्हा तयार करण्यास अनुमती देते. ठराविक भाषण वैशिष्ट्यांवर आधारित.

कोडेकमध्ये एन्कोडर आणि डीकोडर समाविष्ट आहे. एन्कोडर अल्गोरिदम दर 20 मिलीसेकंदांनी व्हॉईस डेटा पॅरामीटर्स काढतो, त्यांना संकुचित करतो आणि प्राप्तकर्त्याकडे हस्तांतरित करतो 3,2 kbps ते 9,2 kbps बिट रेटसह नेटवर्कवर.

रिसीव्हरच्या बाजूने, डीकोडर ट्रान्समिटेड ऑडिओ पॅरामीटर्सवर आधारित मूळ स्पीच सिग्नल पुन्हा तयार करण्यासाठी जनरेटिव्ह मॉडेल वापरतो, ज्यामध्ये लॉगरिदमिक चॉक स्पेक्ट्रोग्रामचा समावेश होतो जे वेगवेगळ्या वारंवारता श्रेणींमध्ये उच्चाराची ऊर्जा वैशिष्ट्ये विचारात घेतात. आणि मानवी श्रवणविषयक धारणा लक्षात घेऊन तयार केले जातात. .

Lyra V2 मध्ये नवीन काय आहे?

Lyra V2 साउंडस्ट्रीम न्यूरल नेटवर्कवर आधारित नवीन जनरेटिव्ह मॉडेल वापरते, ज्यात कमी संगणकीय आवश्यकता आहेत, कमी-पॉवर सिस्टमवरही रिअल-टाइम डीकोडिंगला अनुमती देते.

ध्वनी निर्माण करण्यासाठी वापरल्या जाणार्‍या मॉडेलला 90 पेक्षा जास्त भाषांमध्ये हजारो तासांचे व्हॉइस रेकॉर्डिंग वापरून प्रशिक्षण दिले गेले आहे (टेन्सरफ्लो लाइट मॉडेल चालविण्यासाठी वापरले जाते). प्रस्तावित अंमलबजावणीचे कार्यप्रदर्शन सर्वात कमी किमतीच्या श्रेणीतील स्मार्टफोनवर आवाज एन्कोड आणि डीकोड करण्यासाठी पुरेसे आहे.

भिन्न जनरेटिव्ह मॉडेल वापरण्याव्यतिरिक्त, नवीन आवृत्ती RVQ क्वांटिफायरसह लिंक्सच्या समावेशासाठी देखील वेगळी आहे कोडेक आर्किटेक्चरमध्ये (अवशिष्ट वेक्टर क्वांटायझर), जे डेटा ट्रान्समिशनपूर्वी प्रेषकाच्या बाजूला आणि डेटा रिसेप्शननंतर प्राप्तकर्त्याच्या बाजूला केले जाते.

क्वांटायझर कोडेकद्वारे प्रदान केलेल्या पॅरामीटर्सचे पॅकेट्सच्या सेटमध्ये रूपांतरित करतो, निवडलेल्या बिट रेटशी संबंधित माहितीचे एन्कोडिंग करतो. विविध गुणवत्तेचे स्तर सुनिश्चित करण्यासाठी, तीन बिटरेट्स (3,2kbps, 6kbps आणि 9,2kbps) साठी क्वांटायझर प्रदान केले जातात, बिटरेट जितका जास्त तितका दर्जा चांगला, परंतु बँडविड्थची आवश्यकता जास्त.

नवीन आर्किटेक्चर ने सिग्नल ट्रान्समिशन विलंब 100 मिलीसेकंद वरून 20 मिलीसेकंद पर्यंत कमी केला आहे. तुलनेसाठी, WebRTC साठी Opus codec ने चाचणी केलेल्या बिट दरांवर 26,5 ms, 46,5 ms आणि 66,5 ms विलंब दर्शविला. एन्कोडर आणि डीकोडरची कार्यक्षमता देखील लक्षणीय वाढली आहे: मागील आवृत्तीच्या तुलनेत, 5 पट पर्यंत प्रवेग आहे. उदाहरणार्थ, Pixel 6 Pro स्मार्टफोनवर, नवीन कोडेक 20ms नमुना 0,57ms मध्ये एन्कोड आणि डीकोड करतो, जो रिअल-टाइम स्ट्रीमिंगसाठी आवश्यक असलेल्या 35 पट वेगवान आहे.

कार्यप्रदर्शन व्यतिरिक्त, आम्ही ध्वनी पुनर्संचयनाची गुणवत्ता सुधारण्यात देखील व्यवस्थापित केले: MUSHRA स्केलनुसार, Lyra V3,2 कोडेक वापरताना 6 kbps, 9,2 kbps आणि 2 kbps बिट दरांवर उच्चार गुणवत्ता 10 kbps च्या बिट दरांशी संबंधित आहे, Opus कोडेक वापरताना 13 kbps आणि 14 kbps.

शेवटी आपल्याला त्याबद्दल अधिक जाणून घेण्यात स्वारस्य असल्यास, आपण तपशील तपासू शकता खालील दुवा.


आपली टिप्पणी द्या

आपला ई-मेल पत्ता प्रकाशित केला जाणार नाही. आवश्यक फील्ड चिन्हांकित केले आहेत *

*

*

  1. डेटा जबाबदार: मिगुएल Áन्गल गॅटन
  2. डेटाचा उद्देशः नियंत्रण स्पॅम, टिप्पणी व्यवस्थापन.
  3. कायदे: आपली संमती
  4. डेटा संप्रेषण: कायदेशीर बंधन वगळता डेटा तृतीय पक्षास कळविला जाणार नाही.
  5. डेटा संग्रहण: ओकेन्टस नेटवर्क (EU) द्वारा होस्ट केलेला डेटाबेस
  6. अधिकारः कोणत्याही वेळी आपण आपली माहिती मर्यादित, पुनर्प्राप्त आणि हटवू शकता.