Google đã phát hành mã nguồn cho Lyra, một codec âm thanh Android 

Một vài ngày trước, Các nhà phát triển của Google đã phát hành thông qua một bài đăng trên blog mà họ đã thực hiện quyết định biến Lyra thành mã nguồn mở. Lyra dựa trên công nghệ máy học để cho phép thực hiện các cuộc gọi thoại chất lượng cao trong các tình huống băng thông thấp.

Với cái này lợi ích và cho phép các nhà phát triển khác cung cấp ứng dụng của họ giao tiếp và phát triển Lyra theo hướng mới.

Là một yếu tố quan trọng của các ứng dụng truyền thông trong nhiều thập kỷ, codec đã cho phép các ứng dụng sử dụng nhiều băng thông để truyền dữ liệu một cách hiệu quả.

Như vậy, phát triển codec, cho cả video và âm thanh, đặt ra một thách thức liên tục- Cung cấp chất lượng ngày càng cao, sử dụng ít dữ liệu hơn và giảm thiểu độ trễ cho giao tiếp theo thời gian thực.

Mặc dù video có thể tiêu tốn nhiều băng thông hơn âm thanh, nhưng codec video hiện đại có thể đạt được tốc độ bit thấp hơn một số codec giọng nói chất lượng cao đang được sử dụng ngày nay.

Sự kết hợp của Các codec thoại và video tốc độ bit thấp có thể mang lại trải nghiệm gọi điện video chất lượng cao ngay cả trên mạng băng thông thấp. Tuy nhiên, về mặt lịch sử, tốc độ bit của codec âm thanh càng thấp thì tín hiệu thoại càng kém dễ hiểu và càng có nhiều robot hơn.

Ngoài ra, trong khi một số người có quyền truy cập vào mạng băng thông rộng chất lượng cao nhất quán, mức độ kết nối này không phổ biến và ngay cả những người sống ở những khu vực kết nối tốt đôi khi cũng gặp phải tình trạng kết nối mạng kém, kết nối mạng kém và kết nối bị thiếu hụt.

Để giải quyết vấn đề này, Google đã tạo Lyra, codec giọng nói chất lượng cao, tốc độ bit cực thấp giúp giao tiếp bằng giọng nói khả dụng ngay cả trên các mạng chậm nhất.

Để làm điều này, Google đã áp dụng các kỹ thuật mã hóa truyền thống trong khi tận dụng những tiến bộ trong học máy với các mô hình được đào tạo qua hàng nghìn giờ dữ liệu để tạo ra một phương pháp nén và truyền tín hiệu thoại mới.

Mã của Lyra được viết bằng C ++ cho tốc độ, hiệu quả và khả năng tương tác, ngoài ra nó sử dụng khung Bazel với Abseil và khung GoogleTest cho các bài kiểm tra đơn vị đầy đủ.

API cơ bản cung cấp một giao diện để mã hóa và giải mã ở cấp độ gói và tệp. Chuỗi công cụ xử lý tín hiệu hoàn chỉnh cũng được cung cấp và bao gồm nhiều bộ lọc và biến đổi khác nhau.

“Ứng dụng mẫu của chúng tôi tích hợp với Android NDK để chỉ ra cách tích hợp mã gốc của Lyra vào một ứng dụng Android dựa trên Java. Chúng tôi cũng cung cấp trọng số vectơ và bộ định lượng cần thiết để chạy Lyra, ”Google cho biết. Bản phát hành này cung cấp các công cụ cần thiết cho các nhà phát triển để mã hóa và giải mã âm thanh bằng Lyra, được tối ưu hóa cho nền tảng ARM Android 64-bit, với phiên bản dành cho Linux.

Các tính năng được giải mã thành dạng sóng bằng cách sử dụng một mô hình tổng quát. Mô hình tạo là một loại mô hình học máy đặc biệt, rất thích hợp để tạo lại một dạng sóng âm thanh hoàn chỉnh từ một số chức năng hạn chế.

Kiến trúc của Lyra rất giống với codec âm thanh truyền thống, vốn là xương sống của truyền thông Internet trong nhiều thập kỷ. Trong khi các codec truyền thống này dựa trên các kỹ thuật xử lý tín hiệu kỹ thuật số, Lyra nằm ở khả năng tái tạo lại tín hiệu giọng nói chất lượng cao của mô hình chung.

Google đã triển khai Lyra trong ứng dụng gọi điện video miễn phí Duo và cho biết họ đang tạo mã nguồn mở vì cho rằng nó có thể phù hợp với các ứng dụng khác.

Google tin rằng có một số ứng dụng mà Lyra có thể phù hợp, cho dù đó là ứng dụng để lưu trữ lượng lớn giọng nói, tiết kiệm pin hay giảm tắc nghẽn mạng trong các tình huống bận rộn.

Google cho biết: “Chúng tôi mong muốn được chứng kiến ​​sự sáng tạo đặc trưng cho cộng đồng nguồn mở được áp dụng cho Lyra để cung cấp các ứng dụng mạnh mẽ và độc đáo.

Fuente: https://opensource.googleblog.com


Nội dung bài viết tuân thủ các nguyên tắc của chúng tôi về đạo đức biên tập. Để báo lỗi, hãy nhấp vào đây.

Hãy là người đầu tiên nhận xét

Để lại bình luận của bạn

địa chỉ email của bạn sẽ không được công bố. Các trường bắt buộc được đánh dấu bằng *

*

*

  1. Chịu trách nhiệm về dữ liệu: Miguel Ángel Gatón
  2. Mục đích của dữ liệu: Kiểm soát SPAM, quản lý bình luận.
  3. Hợp pháp: Sự đồng ý của bạn
  4. Truyền thông dữ liệu: Dữ liệu sẽ không được thông báo cho các bên thứ ba trừ khi có nghĩa vụ pháp lý.
  5. Lưu trữ dữ liệu: Cơ sở dữ liệu do Occentus Networks (EU) lưu trữ
  6. Quyền: Bất cứ lúc nào bạn có thể giới hạn, khôi phục và xóa thông tin của mình.