Google je objavio izvorni kod za Lyru, Android audio kodek 

Prije nekoliko dana Objavljeni Google programeri putem bloga koji su zauzeli odluka da se Lyra učini otvorenim. Lyra se temelji na mašinskom učenju kako bi omogućila visokokvalitetne glasovne pozive u situacijama niske propusnosti.

Sa kojim ovo koristi i omogućava drugim programerima da hrane svoje aplikacije komunicirati i razvijati Lyru u novim pravcima.

Kodeci koji su decenijama bili glavna medijska aplikacija omogućili su aplikacijama sa širokim propusnim opsegom da efikasno prenose podatke.

Kao takav, razvoj kodeka, kako za video tako i za zvuk, predstavlja stalni izazov- Omogućite sve veći kvalitet, koristite manje podataka i smanjite kašnjenje za komunikaciju u stvarnom vremenu.

Iako se čini da video troši mnogo više propusnosti od zvuka, moderni video kodeci mogu postići niže brzine prijenosa od nekih visokokvalitetnih govornih kodeka koji se danas koriste.

Kombinacija Glasovni i video kodeci niske brzine prijenosa mogu donijeti visokokvalitetno iskustvo video poziva čak i na mrežama s niskom propusnošću. Međutim, povijesno gledano, što je niža brzina prijenosa zvuka u audio kodeku, to je glas manje razumljiv i utoliko je robotiziraniji.

Također, dok neki ljudi imaju pristup konzistentnoj visokokvalitetnoj širokopojasnoj mreži, ovaj nivo povezanosti nije univerzalan, pa čak i ljudi koji žive u dobro povezanim područjima ponekad se suočavaju s lošim mrežnim vezama, lošim mrežnim vezama i nedostatkom povezanosti.

Da biste riješili ovaj problem, Google je stvorio Lyru, visokokvalitetni, govorni kodek ultra-niske brzine prijenosa što govornu komunikaciju čini dostupnom čak i na najsporijim mrežama.

Da biste to učinili, Google je primijenio tradicionalne tehnike kodiranja, koristeći prednosti u mašinskom učenju sa modelima obučenim tokom hiljada sati podataka za stvaranje nove metode kompresije i prenosa glasovnih signala.

Lyrin kod je napisan na C ++ za brzinu, efikasnosti i interoperabilnosti, plus koristi okvir Bazel s Abseilom i GoogleTest okvir za cjelovite jedinstvene testove.

Basic API pruža sučelje za kodiranje i dekodiranje na nivou paketa i datoteka. Kompletan lanac alata za obradu signala je također osiguran i uključuje razne filtere i transformacije.

„Naš uzorak aplikacije integrira se s Android NDK da bi pokazao kako integrirati Lyrin izvorni kôd u Android aplikaciju zasnovanu na Javi. Također pružamo vektorske težine i kvantifikatore potrebne za pokretanje Lyre ”, rekao je Google. Ovo izdanje pruža potrebne alate za programere za kodiranje i dekodiranje zvuka s Lyrom, optimiziranom za 64-bitnu Android ARM platformu, sa verzijom za Linux.

Karakteristike se dekodiraju u valni oblik pomoću generativnog modela. Generativni modeli su posebna vrsta modela mašinskog učenja koja je pogodna za rekreiranje kompletnog audio talasa iz ograničenog broja funkcija.

Lyrina arhitektura je vrlo slična tradicionalnim audio kodecima, koji su već desetljećima okosnica internetske komunikacije. Iako su ovi tradicionalni kodeci zasnovani na tehnikama digitalne obrade signala, Lyra počiva na sposobnosti generativnog modela da rekonstruira visokokvalitetni govorni signal.

Google je implementirao Lyru u svoju besplatnu aplikaciju za video pozive Duo i rekao da kôd čini otvorenim kodom jer smatra da bi mogao biti pogodan za druge aplikacije.

Google vjeruje da postoji niz aplikacija za koje bi Lyra mogla biti prikladna, bilo da se radi o arhiviranju velike količine glasa, uštedi trajanja baterije ili ublažavanju zagušenja mreže u zauzetim situacijama.

"Radujemo se što ćemo vidjeti kreativnost koja karakterizira zajednicu otvorenog koda primijenjenu na Lyru za isporuku moćnih i jedinstvenih aplikacija", rekao je Google.

Izvor: https://opensource.googleblog.com


Ostavite komentar

Vaša e-mail adresa neće biti objavljena. Obavezna polja su označena sa *

*

*

  1. Za podatke odgovoran: Miguel Ángel Gatón
  2. Svrha podataka: Kontrola neželjene pošte, upravljanje komentarima.
  3. Legitimacija: Vaš pristanak
  4. Komunikacija podataka: Podaci se neće dostavljati trećim stranama, osim po zakonskoj obavezi.
  5. Pohrana podataka: Baza podataka koju hostuje Occentus Networks (EU)
  6. Prava: U bilo kojem trenutku možete ograničiti, oporaviti i izbrisati svoje podatke.