구글, 안드로이드 오디오 코덱 라이라 소스 코드 공개 

며칠 전 Google 개발자 출시 그들이 찍은 블로그 게시물을 통해 Lyra를 오픈 소스로 만들기로 결정했습니다. Lyra는 저 대역폭 상황에서 고품질 음성 통화를 가능하게하는 기계 학습을 기반으로합니다.

이것으로 다른 개발자가 자신의 애플리케이션을 공급할 수 있습니다. 소통하고 새로운 방향으로 Lyra를 개발합니다.

수십 년 동안 미디어 애플리케이션의 필수 요소였던 코덱은 대역폭 집약적 인 애플리케이션이 데이터를 효율적으로 전송할 수 있도록 해왔습니다.

따라서 비디오와 오디오 모두를위한 코덱 개발은 지속적인 도전을 제시합니다.-더 높은 품질을 제공하고 데이터를 적게 사용하며 실시간 통신을위한 지연 시간을 최소화합니다.

비디오가 오디오보다 훨씬 더 많은 대역폭을 소비하는 것처럼 보일 수 있지만 최신 비디오 코덱은 오늘날 사용되는 일부 고품질 음성 코덱보다 낮은 비트 전송률을 달성 할 수 있습니다.

의 조합 낮은 비트 전송률의 음성 및 비디오 코덱은 고품질 화상 통화 경험을 제공 할 수 있습니다. 낮은 대역폭 네트워크에서도. 그러나 역사적으로 오디오 코덱의 비트 전송률이 낮을수록 음성 신호의 이해도가 떨어지고 더 로봇 적입니다.

또한 일부 사람들은 일관된 고품질 광대역 네트워크에 액세스 할 수 있지만이 수준의 연결은 보편적이지 않으며 잘 연결된 지역에 사는 사람들조차도 네트워크 연결 불량, 네트워크 연결 불량 및 연결 상태에 직면합니다.

이 문제를 해결하기 위해 Google은 고품질의 초저 비트율 음성 코덱 인 Lyra를 만들었습니다. 가장 느린 네트워크에서도 음성 통신을 사용할 수 있습니다.

이렇게하려면 Google은 진보 된 기술을 활용하면서 전통적인 코딩 기술을 적용했습니다. 수천 시간 분량의 데이터를 학습 한 모델을 사용하여 새로운 음성 신호 압축 및 전송 방법을 만드는 머신 러닝에서

Lyra의 코드는 속도를 위해 C ++로 작성되었습니다. 효율성 및 상호 운용성 외에도 Abseil과 함께 Bazel 프레임 워크를 사용하고 전체 단위 테스트를 위해 GoogleTest 프레임 워크를 사용합니다.

Basic API는 패킷 및 파일 수준에서 인코딩 및 디코딩을위한 인터페이스를 제공합니다. 완전한 신호 처리 툴체인도 제공되며 다양한 필터 및 변환을 포함합니다.

“우리의 샘플 애플리케이션은 Android NDK와 통합되어 Lyra의 네이티브 코드를 Java 기반 Android 애플리케이션에 통합하는 방법을 보여줍니다. 또한 Lyra를 실행하는 데 필요한 벡터 가중치와 수량도 제공합니다.”라고 Google은 말했습니다. 이 릴리스에서는 개발자가 Linux 용 버전으로 64 비트 Android ARM 플랫폼에 최적화 된 Lyra로 오디오를 인코딩하고 디코딩하는 데 필요한 도구를 제공합니다.

기능은 생성 모델을 사용하여 파형으로 디코딩됩니다. 생성 모델은 제한된 수의 기능에서 완전한 오디오 파형을 재현하는 데 적합한 특수 유형의 기계 학습 모델입니다.

Lyra의 아키텍처는 기존 오디오 코덱과 매우 유사합니다., 수십 년 동안 인터넷 통신의 중추 역할을 해왔습니다. 이러한 전통적인 코덱은 디지털 신호 처리 기술을 기반으로하지만 Lyra는 고품질 음성 신호를 재구성하는 생성 모델의 기능에 있습니다.

구글은 무료 화상 통화 앱 듀오에 Lyra를 구현했으며 다른 앱에 적합 할 것이라고 생각하기 때문에 코드를 오픈 소스로 만들고 있다고 말했다.

Google은 Lyra가 많은 양의 음성을 보관하거나 배터리 수명을 절약하거나 바쁜 상황에서 네트워크 정체를 완화하는 데 적합한 앱이 많이 있다고 생각합니다.

"우리는 강력하고 고유 한 애플리케이션을 제공하기 위해 Lyra에 적용된 오픈 소스 커뮤니티를 특징 짓는 창의력을 기대합니다."라고 Google은 말했습니다.

출처 : https://opensource.googleblog.com


코멘트를 첫번째로 올려

코멘트를 남겨주세요

귀하의 이메일 주소는 공개되지 않습니다. 필수 필드가 표시되어 있습니다 *

*

*

  1. 데이터 책임자 : Miguel Ángel Gatón
  2. 데이터의 목적 : 스팸 제어, 댓글 관리.
  3. 합법성 : 귀하의 동의
  4. 데이터 전달 : 법적 의무에 의한 경우를 제외하고 데이터는 제 XNUMX 자에게 전달되지 않습니다.
  5. 데이터 저장소 : Occentus Networks (EU)에서 호스팅하는 데이터베이스
  6. 권리 : 귀하는 언제든지 귀하의 정보를 제한, 복구 및 삭제할 수 있습니다.