Google allibero el codi font de Lyra, un codec d'àudio d'Android 

Fa pocs dies els desenvolupadors de Google van donar a conèixer mitjançant una publicació de bloc que han pres la decisió de fer que Lyra sigui de codi obert. Lyra es basa en l'aprenentatge automàtic per permetre trucades de veu d'alta qualitat en situacions d'ample de banda baix.

Amb la qual cosa això beneficia i permet a altres desenvolupadors alimentar les seves aplicacions de comunicació i desenvolupar Lyra en noves direccions.

Un element bàsic de les aplicacions de mitjans durant dècades, els còdecs han permès que les aplicacions amb ús intensiu d'ample de banda transmetin dades de manera eficient.

Com a tal, el desenvolupament de còdecs, tant per vídeo com per a àudio, presenta un desafiament continu: Proporcionar una qualitat cada vegada més gran, fer servir menys dades i minimitzar la latència per a la comunicació en temps real.

Tot i que el vídeo pot semblar que consumeix molt més ample de banda que l'àudio, els còdecs de vídeo moderns poden aconseguir taxes de bits més baixes que alguns dels còdecs de veu d'alta qualitat que s'utilitzen en l'actualitat.

La combinació de còdecs de veu i vídeo de baixa taxa de bits pot brindar una experiència de videotrucades d'alta qualitat fins i tot en xarxes amb poc ample de banda. No obstant això, històricament, com menor és la taxa de bits d'un còdec d'àudio, menys intel·ligible és el senyal de veu i més robòtica és.

A més, tot i que algunes persones tenen accés a una xarxa de banda ampla d'alta qualitat constant, aquest nivell de connectivitat no és universal, i fins i tot les persones que viuen en àrees ben connectades a vegades s'enfronten connexions de xarxa deficients, connexions de xarxa deficients i connectivitat deficient.

Per resoldre aquest problema, Google va crear Lyra, un còdec de veu d'alta qualitat i taxa de bits ultrabaixa que fa que la comunicació de veu estigui disponible fins i tot en les xarxes més lentes.

Per fer això, Google va aplicar tècniques de codificació tradicionals mentre aprofitava els avenços en l'aprenentatge automàtic amb models entrenats durant milers d'hores de dades per crear un nou mètode de compressió i transmissió de senyals de veu.

El codi de Lyra està escrit en C ++ per brindar velocitat, eficiència i interoperabilitat, a més de que utilitza el marc Bazel amb Abseil i el marc GoogleTest per a proves unitàries completes.

L'API bàsica proporciona una interfície per a la codificació i descodificació a nivell de paquets i arxius. També es proporciona la cadena d'eines de processament de senyals completa i inclou diversos filtres i transformacions.

"La nostra aplicació de mostra s'integra amb el NDK d'Android per mostrar com integrar el codi natiu de Lyra en una aplicació d'Android basada en Java. També proporcionem els pesos vectorials i els quantificadors necessaris per a executar Lyra ", va dir Google. Aquesta versió proporciona les eines necessàries perquè els desenvolupadors codifiquin i descodifiquen el àudio amb Lyra, optimitzat per a la plataforma Android ARM de 64 bits, amb una versió per a Linux.

Les característiques es descodifiquen en forma d'ona mitjançant un model generatiu. Els models generatius són un tipus especial de model d'aprenentatge automàtic molt adequat per recrear una forma d'ona d'àudio completa a partir d'un nombre limitat de funcions.

L'arquitectura de Lyra és molt similar als còdecs d'àudio tradicionals, Que han estat la columna vertebral de la comunicació per Internet durant dècades. Si bé aquests còdecs tradicionals es basen en tècniques de processament de senyals digitals, Lyra resideix en la capacitat de el model generatiu per reconstruir un senyal de veu d'alta qualitat.

Google va implementar Lyra en la seva aplicació gratuïta de videotrucades Duo i va dir que estava fent el codi de codi obert perquè creu que podria ser adequat per a altres aplicacions.

Google creu que hi ha una sèrie d'aplicacions per a les quals Lyra podria ser adequada, ja sigui per arxivar grans quantitats de veu, estalviar bateria o alleujar la congestió de la xarxa en situacions de molta activitat.

«Esperem veure la creativitat que caracteritza a la comunitat de codi obert aplicada a Lyra per oferir aplicacions úniques i impactants», va dir Google.

font: https://opensource.googleblog.com


Deixa el teu comentari

La seva adreça de correu electrònic no es publicarà. Els camps obligatoris estan marcats amb *

*

*

  1. Responsable de les dades: Miguel Ángel Gatón
  2. Finalitat de les dades: Controlar l'SPAM, gestió de comentaris.
  3. Legitimació: El teu consentiment
  4. Comunicació de les dades: No es comunicaran les dades a tercers excepte per obligació legal.
  5. Emmagatzematge de les dades: Base de dades allotjada en Occentus Networks (UE)
  6. Drets: En qualsevol moment pots limitar, recuperar i esborrar la teva informació.