Google publikigis la fontkodon por Lyra, Android-sonkodeko 

Antaŭ kelkaj tagoj la Google-programistoj liberigis per bloga afiŝo, kiun ili prenis la decido fari Lyra malferma fonto. Lyra baziĝas sur maŝina lernado por ebligi altkvalitajn voĉalvokojn en situacioj de malalta larĝa bando.

Kun kiu ĉi tio utilas kaj permesas al aliaj programistoj nutri siajn programojn komunikado kaj disvolvi Lyra en novaj direktoj.

Bazvaro de amaskomunikilaj programoj dum jardekoj, kodekoj ebligis larĝ-intensajn bendojn de aplikoj transdoni datumojn efike.

Tiel, kodeka disvolviĝo, por kaj video kaj sono, prezentas daŭran defion- Provizu ĉiam pli altan kvaliton, uzu malpli da datumoj kaj minimumigu latentecon por realtempa komunikado.

Kvankam video eble ŝajnas multe pli larĝa de bando ol audio, modernaj video-kodekoj povas atingi malpli altajn bitajn rapidojn ol iuj el la altkvalitaj parolaj kodekoj uzataj hodiaŭ.

La kombinaĵo de Malaltaj bitoftaj voĉaj kaj videaj kodekoj povas alporti altkvalitan videovokan sperton eĉ ĉe retoj kun malalta larĝa bando. Tamen, historie, ju pli malalta estas la bita rapideco de sonkodeko, des malpli komprenebla estas la voĉa signalo kaj des pli robota ĝi estas.

Ankaŭ, dum iuj homoj havas aliron al konsekvenca altkvalita larĝbenda reto, ĉi tiu nivelo de konektebleco ne estas universala, kaj eĉ homoj, kiuj loĝas en bone konektitaj lokoj, foje alfrontas malbonajn retajn konektojn, malbonajn retajn konektojn kaj konektecon.

Por solvi ĉi tiun problemon, Google kreis Lyra, altkvalitan, tre malalt-bit-rapidan parolkodekon kiu disponigas voĉan komunikadon eĉ sur la plej malrapidaj retoj.

Por fari tion, Google aplikis tradiciajn kodajn teknikojn utiligante progresojn en maŝina lernado kun modeloj trejnitaj dum miloj da horoj da datumoj por krei novan metodon de kunpremo kaj transdono de voĉaj signaloj.

La kodo de Lyra estas skribita en C ++ por rapideco, efikeco kaj kunfunkciebleco, krome ĝi uzas la Bazel-kadron kun Abseil kaj la GoogleTest-kadron por plenaj unuopaj testoj.

La Baza API provizas interfacon por kodigi kaj malkodigi je la nivelo de pakaĵeto kaj dosiero. La kompleta ilo-ĉeno de signal-prilaborado ankaŭ estas provizita kaj inkluzivas diversajn filtrilojn kaj transformojn.

“Nia specimena aplikaĵo integras kun la Android NDK por montri kiel integri la denaskan kodon de Lyra en Java-bazitan Android-aplikaĵon. Ni ankaŭ provizas la vektorajn pezojn kaj kvantumilojn necesajn por funkciigi Lyra, "Google diris. Ĉi tiu eldono provizas la necesajn ilojn por programistoj por kodigi kaj deĉifri sonon per Lyra, optimumigita por la platformo 64-bita Android ARM, kun versio por Linukso.

Ecoj estas deĉifritaj en ondformon uzante generan modelon. Generaj modeloj estas speciala speco de maŝina lernada modelo bone taŭga por rekrei kompletan sonan ondformon de limigita nombro da funkcioj.

La arkitekturo de Lyra tre similas al tradiciaj sonkodekoj, kiuj estis la spino de interreta komunikado dum jardekoj. Dum ĉi tiuj tradiciaj kodekoj baziĝas sur ciferecaj signal-prilaboraj teknikoj, Liro loĝas en la kapablo de la genera modelo rekonstrui altkvalitan parolan signalon.

Google efektivigis Lyra en sia senpaga videovokanta programo Duo kaj diris, ke ĝi faras la kodon malfermfonteco, ĉar ĝi pensas, ke ĝi taŭgas por aliaj programoj.

Google kredas, ke ekzistas multaj programoj, por kiuj Lyra taŭgas, ĉu por arkivi grandajn kvantojn de voĉo, ŝpari baterian vivon, aŭ mildigi retan kongestadon en okupataj situacioj.

"Ni antaŭĝojas vidi la kreivon, kiu karakterizas la malfermfontecan komunumon, aplikitan al Lyra por liveri potencajn kaj unikajn aplikojn," diris Google.

Fonto: https://opensource.googleblog.com


La enhavo de la artikolo aliĝas al niaj principoj de redakcia etiko. Por raporti eraron alklaku Ĉi tie.

Estu la unua por komenti

Lasu vian komenton

Via retpoŝta adreso ne estos eldonita. Postulita kampojn estas markita per *

*

*

  1. Respondeculo pri la datumoj: Miguel Ángel Gatón
  2. Celo de la datumoj: Kontrola SPAM, administrado de komentoj.
  3. Legitimado: Via konsento
  4. Komunikado de la datumoj: La datumoj ne estos komunikitaj al triaj krom per laŭleĝa devo.
  5. Stokado de datumoj: Datumbazo gastigita de Occentus Networks (EU)
  6. Rajtoj: Iam ajn vi povas limigi, retrovi kaj forigi viajn informojn.