Google släppte källkoden för Lyra, en Android-ljudkod 

För några dagar sedan Google-utvecklare släpptes via ett blogginlägg som de har tagit beslutet att göra Lyra öppen källkod. Lyra bygger på maskininlärning för att möjliggöra röstsamtal av hög kvalitet i situationer med låg bandbredd.

Med vilken detta fördelar och låter andra utvecklare mata sina applikationer kommunikation och utveckla Lyra i nya riktningar.

En häftklammer av mediatillämpningar i årtionden har codecs gjort det möjligt för bandbreddsintensiva applikationer att överföra data effektivt.

Som sådan, codec-utveckling, för både video och ljud, är en ständig utmaning- Ge allt högre kvalitet, använd mindre data och minimera latens för realtidskommunikation.

Även om video kan tyckas konsumera mycket mer bandbredd än ljud, kan moderna videokodecer uppnå lägre bithastigheter än några av de högkvalitativa talkoderna som används idag.

Kombinationen av Röst- och videokodecer med låg bithastighet kan ge videosamtal av hög kvalitet även på nätverk med låg bandbredd. Historiskt är dock ju lägre bithastigheten för en ljudkod, desto mindre begriplig är röstsignalen och desto mer robot är den.

Även om vissa människor har tillgång till ett bredbandsnät av hög kvalitet är denna anslutningsnivå inte universell, och även människor som bor i väl anslutna områden möter ibland dåliga nätverksanslutningar, dåliga nätverksanslutningar och anslutningsmöjligheter.

För att lösa det här problemet, Google skapade Lyra, en högkvalitativ, högkvalitativ talkodek för ultrahöga hastigheter vilket gör röstkommunikation tillgänglig även i de långsammaste nätverken.

För att göra detta, Google använde traditionella kodningstekniker samtidigt som de utnyttjade framstegen inom maskininlärning med modeller utbildade över tusentals timmar med data för att skapa en ny metod för komprimering och överföring av röstsignaler.

Lyras kod är skriven i C ++ för hastighet, effektivitet och interoperabilitet, plus att det använder Bazel-ramverket med Abseil och GoogleTest-ramverket för fullständig enhetstestning.

Basic API ger ett gränssnitt för kodning och avkodning på paket- och filnivå. Den kompletta signalbehandlingsverktygskedjan tillhandahålls också och innehåller olika filter och transformationer.

”Vår exempelapplikation integreras med Android NDK för att visa hur man integrerar Lyras inbyggda kod i en Java-baserad Android-applikation. Vi tillhandahåller också de vikter och kvantifierare som krävs för att köra Lyra, säger Google. Denna version ger de nödvändiga verktygen för utvecklare att koda och avkoda ljud med Lyra, optimerad för 64-bitars Android ARM-plattform, med en version för Linux.

Funktioner avkodas till vågform med en generativ modell. Generativa modeller är en speciell typ av maskininlärningsmodell som är väl lämpad för att återskapa en komplett ljudvågform från ett begränsat antal funktioner.

Lyras arkitektur liknar mycket traditionella ljudkodek, som har varit ryggraden i Internetkommunikation i årtionden. Medan dessa traditionella codecs är baserade på digital signalbehandlingsteknik, ligger Lyra i den generativa modellens förmåga att rekonstruera en högkvalitets talsignal.

Google implementerade Lyra i sin gratis videosamtal-app Duo och sa att den gjorde koden öppen källkod eftersom den tror att den kan vara lämplig för andra appar.

Google tror att det finns ett antal appar som Lyra kan vara lämpliga för, oavsett om det är för arkivering av stora mängder röst, för att spara batteritid eller för att lindra nätverksbelastning i upptagna situationer.

"Vi ser fram emot att se den kreativitet som kännetecknar öppen källkodsgrupp som tillämpas på Lyra för att leverera kraftfulla och unika applikationer", säger Google.

Fuente: https://opensource.googleblog.com


Lämna din kommentar

Din e-postadress kommer inte att publiceras. Obligatoriska fält är markerade med *

*

*

  1. Ansvarig för uppgifterna: Miguel Ángel Gatón
  2. Syftet med uppgifterna: Kontrollera skräppost, kommentarhantering.
  3. Legitimering: Ditt samtycke
  4. Kommunikation av uppgifterna: Uppgifterna kommer inte att kommuniceras till tredje part förutom enligt laglig skyldighet.
  5. Datalagring: databas värd för Occentus Networks (EU)
  6. Rättigheter: När som helst kan du begränsa, återställa och radera din information.