Google a lansat codul sursă pentru Lyra, un codec audio Android 

Acum câteva zile Dezvoltatorii Google au lansat printr-o postare pe blog pe care au luat-o decizia de a face Lyra open source. Lyra se bazează pe învățarea automată pentru a permite apeluri vocale de înaltă calitate în situații de lățime de bandă redusă.

Cu care aceasta beneficiază și permite altor dezvoltatori să-și alimenteze aplicațiile comunicarea și dezvoltarea Lyrei în direcții noi.

O bază a aplicațiilor media de zeci de ani, codecurile au permis aplicațiilor care utilizează o lățime de bandă intensă să transmită datele în mod eficient.

Ca atare, dezvoltarea codecurilor, atât pentru video cât și pentru audio, prezintă o provocare continuă- Oferiți o calitate tot mai ridicată, utilizați mai puține date și reduceți latența pentru comunicarea în timp real.

Deși videoclipurile pot părea să consume mult mai multă lățime de bandă decât audio, codecurile video moderne pot atinge rate de biți mai mici decât unele dintre codecurile de vorbire de înaltă calitate utilizate în prezent.

Combinația de Codecurile vocale și video cu rată de biți redusă pot aduce experiență de apel video video de înaltă calitate chiar și pe rețele cu lățime de bandă redusă. Cu toate acestea, din punct de vedere istoric, cu cât rata de biți a unui codec audio este mai mică, cu atât este mai puțin inteligibil semnalul vocal și cu atât este mai robotizat.

De asemenea, în timp ce unii oameni au acces la o rețea de bandă largă consistentă de înaltă calitate, acest nivel de conectivitate nu este universal și chiar și persoanele care locuiesc în zone bine conectate se confruntă uneori cu conexiuni de rețea slabe, conexiuni de rețea slabe și conectivitate.

Pentru a rezolva această problemă, Google a creat Lyra, un codec de vorbire de înaltă calitate, cu rată de biți foarte scăzută ceea ce face ca comunicarea vocală să fie disponibilă chiar și în cele mai lente rețele.

Pentru a face acest lucru, Google a aplicat tehnici tradiționale de codificare, profitând în același timp de avansuri în învățarea automată cu modele antrenate pe mii de ore de date pentru a crea o nouă metodă de compresie și transmitere a semnalelor vocale.

Codul Lyrei este scris în C ++ pentru viteză, eficiență și interoperabilitate, plus că folosește cadrul Bazel cu Abseil și cadrul GoogleTest pentru teste unitare complete.

API-ul de bază oferă o interfață pentru codificare și decodare la nivel de pachet și fișier. De asemenea, este furnizat lanțul de instrumente complete de procesare a semnalului și include diverse filtre și transformări.

„Aplicația noastră eșantionă se integrează cu Android NDK pentru a arăta cum să integreze codul nativ Lyra într-o aplicație Android bazată pe Java. De asemenea, oferim greutățile vectoriale și cuantificatoarele necesare pentru a rula Lyra ", a spus Google. Această versiune oferă instrumentele necesare dezvoltatorilor pentru a codifica și decoda sunetul cu Lyra, optimizat pentru platforma Android ARM pe 64 de biți, cu o versiune pentru Linux.

Caracteristicile sunt decodificate în formă de undă utilizând un model generativ. Modelele generative sunt un tip special de model de învățare automată, potrivit pentru recrearea unei forme de undă audio complete dintr-un număr limitat de funcții.

Arhitectura Lyra este foarte asemănătoare cu codecurile audio tradiționale, care au constituit coloana vertebrală a comunicării pe internet de zeci de ani. În timp ce aceste codecuri tradiționale se bazează pe tehnici de procesare a semnalului digital, Lyra rezidă în capacitatea modelului generativ de a reconstrui un semnal de vorbire de înaltă calitate.

Google a implementat Lyra în aplicația gratuită de apeluri video Duo și a spus că face codul open source, deoarece crede că ar putea fi potrivit pentru alte aplicații.

Google consideră că există o serie de aplicații pentru care Lyra ar putea fi potrivite, fie că este vorba de arhivarea unor cantități mari de voce, economisirea duratei de viață a bateriei sau ușurarea congestiei rețelei în situații aglomerate.

„Așteptăm cu nerăbdare să vedem creativitatea care caracterizează comunitatea open source aplicată Lyra pentru a oferi aplicații puternice și unice”, a spus Google.

Fuente: https://opensource.googleblog.com


Fii primul care comenteaza

Lasă comentariul tău

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

*

*

  1. Responsabil pentru date: Miguel Ángel Gatón
  2. Scopul datelor: Control SPAM, gestionarea comentariilor.
  3. Legitimare: consimțământul dvs.
  4. Comunicarea datelor: datele nu vor fi comunicate terților decât prin obligație legală.
  5. Stocarea datelor: bază de date găzduită de Occentus Networks (UE)
  6. Drepturi: în orice moment vă puteți limita, recupera și șterge informațiile.