گوگل کد منبع Lyra ، کدک صوتی اندروید را منتشر کرد 

چند روز پیش توسعه دهندگان گوگل منتشر شد از طریق پست وبلاگی که گرفته اند تصمیم برای ایجاد منبع آزاد لایرا. Lyra مبتنی بر یادگیری ماشین است تا بتواند تماس های صوتی با کیفیت بالا را در موقعیت های پهنای باند کم انجام دهد.

با که این مزایا و اجازه می دهد تا توسعه دهندگان دیگر برنامه های خود را تغذیه ارتباطات و توسعه Lyra در جهت های جدید.

رمزگذارها که برای دهه ها جز applications اصلی برنامه های رسانه ای بودند ، برنامه های پهنای باند را قادر به انتقال م dataثر داده ها می کنند.

همینطور، توسعه کدک ، هم برای فیلم و هم برای صدا ، یک چالش مداوم است- کیفیت همیشه بالاتر را فراهم کنید ، از داده های کمتری استفاده کنید و تأخیر را برای برقراری ارتباط در زمان واقعی به حداقل برسانید.

اگرچه به نظر می رسد که ویدئو پهنای باند بیشتری نسبت به صدا مصرف می کند ، رمزگذارهای ویدئویی مدرن می توانند نرخ بیت کمتری را نسبت به برخی از کدک های گفتاری با کیفیت بالا که امروزه استفاده می شود ، بدست آورند.

ترکیبی از کدک های صوتی و ویدئویی با نرخ بیت پایین می توانند تجربه تماس ویدیویی با کیفیت بالا را به وجود آورند حتی در شبکه های پهنای باند با این حال ، از نظر تاریخی ، هرچه نرخ بیت یک کدک صوتی کمتر باشد ، سیگنال صوتی قابل درک و رباتیک تری است.

همچنین ، در حالی که برخی از افراد به یک شبکه پهن باند پایدار با کیفیت بالا دسترسی دارند ، این سطح از اتصال جهانی نیست و حتی افرادی که در مناطق کاملاً متصل زندگی می کنند ، گاهی اوقات با اتصالات شبکه ضعیف ، اتصالات شبکه ضعیف و اتصالات مواجه هستند.

برای حل این مشکل، گوگل Lyra را ایجاد کرد ، یک کدک گفتاری با کیفیت بالا و بسیار کم سرعت که ارتباط صوتی را حتی در کندترین شبکه ها نیز در دسترس قرار می دهد.

برای انجام این کار ، گوگل ضمن بهره گیری از پیشرفت ها ، از تکنیک های سنتی کدگذاری استفاده می کند در یادگیری ماشینی با مدل هایی که هزاران ساعت داده آموزش دیده اند تا روش جدیدی از فشرده سازی و انتقال سیگنال های صوتی ایجاد شود.

کد Lyra برای سرعت در ++ C نوشته شده است ، کارآیی و قابلیت همکاری ، به علاوه از چارچوب بازل با Abseil و چارچوب GoogleTest برای آزمایشات کامل واحد استفاده می کند.

Basic API رابطی برای رمزگذاری و رمزگشایی در سطح بسته و پرونده فراهم می کند. ابزار کامل پردازش سیگنال نیز ارائه شده است و شامل فیلترها و تبدیل های مختلف است.

"نمونه برنامه ما با Android NDK ادغام می شود تا نحوه ادغام کد بومی Lyra را در یک برنامه آندروید مبتنی بر جاوا نشان دهد. ما همچنین وزن بردارها و کمیت سازهای مورد نیاز برای اجرای Lyra را تهیه می کنیم. ”گوگل گفت. این نسخه ابزارهای لازم برای توسعه دهندگان را برای رمزگذاری و رمزگشایی صدا با Lyra ، بهینه شده برای پلت فرم 64 بیتی Android ARM ، با نسخه برای Linux فراهم می کند.

ویژگی ها با استفاده از یک مدل تولیدی به شکل موج رمزگشایی می شوند. مدل های تولیدی نوع خاصی از مدل یادگیری ماشین هستند که برای بازآفرینی یک شکل موج صوتی کامل از تعداد محدودی از عملکردها مناسب هستند.

معماری Lyra شباهت زیادی به کدک های صوتی سنتی دارد، که ستون فقرات ارتباطات اینترنتی برای چندین دهه بوده است. در حالی که این کدک های سنتی مبتنی بر تکنیک های پردازش سیگنال دیجیتال هستند ، Lyra در توانایی مدل مولد برای بازسازی سیگنال گفتاری با کیفیت بالا قرار دارد.

گوگل Lyra را در برنامه تماس تصویری رایگان Duo خود پیاده سازی کرد و گفت که کد را به عنوان منبع باز در می آورد زیرا فکر می کند برای برنامه های دیگر مناسب است.

گوگل معتقد است که تعدادی از برنامه ها وجود دارد که Lyra ممکن است برای آنها مناسب باشد ، چه برای بایگانی کردن مقدار زیادی صدا ، صرفه جویی در مصرف باتری یا کاهش ازدحام شبکه در شرایط شلوغ.

گوگل گفت: "ما مشتاقانه منتظر دیدن خلاقیتی هستیم که مشخصه جامعه منبع باز است و از Lyra برای ارائه برنامه های قدرتمند و منحصر به فرد استفاده می شود."

Fuente: https://opensource.googleblog.com


محتوای مقاله به اصول ما پیوست اخلاق تحریریه. برای گزارش یک خطا کلیک کنید اینجا.

اولین کسی باشید که نظر

نظر خود را بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخشهای موردنیاز علامتگذاری شدهاند با *

*

*

  1. مسئول داده ها: میگل آنخل گاتون
  2. هدف از داده ها: کنترل هرزنامه ، مدیریت نظرات.
  3. مشروعیت: رضایت شما
  4. ارتباط داده ها: داده ها به اشخاص ثالث منتقل نمی شوند مگر با تعهد قانونی.
  5. ذخیره سازی داده ها: پایگاه داده به میزبانی شبکه های Occentus (EU)
  6. حقوق: در هر زمان می توانید اطلاعات خود را محدود ، بازیابی و حذف کنید.