ไม่กี่วันที่ผ่านมา นักพัฒนาของ Google เปิดตัว ผ่านบล็อกโพสต์ที่พวกเขาถ่าย การตัดสินใจสร้างโอเพ่นซอร์ส Lyra Lyra ใช้การเรียนรู้ของเครื่องเพื่อเปิดใช้งานการโทรด้วยเสียงคุณภาพสูงในสถานการณ์ที่มีแบนด์วิธต่ำ
ด้วยซึ่งสิ่งนี้ ประโยชน์และช่วยให้นักพัฒนารายอื่นสามารถป้อนแอปพลิเคชันของตนได้ การสื่อสารและพัฒนา Lyra ในทิศทางใหม่
ตัวแปลงสัญญาณหลักของแอปพลิเคชันสื่อมานานหลายทศวรรษได้เปิดใช้งานแอปพลิเคชันที่ใช้แบนด์วิธสูงเพื่อส่งข้อมูลได้อย่างมีประสิทธิภาพ
เช่นนี้ การพัฒนาตัวแปลงสัญญาณสำหรับทั้งวิดีโอและเสียงเป็นความท้าทายอย่างต่อเนื่อง- ให้คุณภาพที่สูงขึ้นตลอดเวลาใช้ข้อมูลน้อยลงและลดเวลาแฝงสำหรับการสื่อสารแบบเรียลไทม์
แม้ว่าวิดีโออาจใช้แบนด์วิดท์มากกว่าเสียง แต่ตัวแปลงสัญญาณวิดีโอสมัยใหม่สามารถให้อัตราบิตต่ำกว่าตัวแปลงสัญญาณเสียงคุณภาพสูงบางตัวที่ใช้อยู่ในปัจจุบัน
การรวมกันของ ตัวแปลงสัญญาณเสียงและวิดีโออัตราบิตต่ำสามารถมอบประสบการณ์การสนทนาทางวิดีโอคุณภาพสูงได้ แม้ในเครือข่ายแบนด์วิธต่ำ อย่างไรก็ตามในอดีตยิ่งอัตราบิตของตัวแปลงสัญญาณเสียงต่ำลงสัญญาณเสียงก็ยิ่งเข้าใจน้อยลงและเป็นหุ่นยนต์มากขึ้น
นอกจากนี้ในขณะที่บางคนสามารถเข้าถึงเครือข่ายบรอดแบนด์คุณภาพสูงที่สม่ำเสมอ แต่การเชื่อมต่อในระดับนี้ก็ไม่เป็นสากลและแม้แต่ผู้ที่อาศัยอยู่ในพื้นที่ที่มีการเชื่อมต่อที่ดีบางครั้งก็ต้องเผชิญกับการเชื่อมต่อเครือข่ายที่ไม่ดีการเชื่อมต่อเครือข่ายที่ไม่ดีและการเชื่อมต่อที่บกพร่อง
เพื่อแก้ปัญหานี้ Google ได้สร้าง Lyra ซึ่งเป็นตัวแปลงสัญญาณเสียงคุณภาพสูงอัตราบิตต่ำเป็นพิเศษ ซึ่งทำให้การสื่อสารด้วยเสียงสามารถใช้งานได้แม้ในเครือข่ายที่ช้าที่สุด
เมื่อต้องการทำสิ่งนี้ Google ใช้เทคนิคการเขียนโค้ดแบบดั้งเดิมในขณะที่ใช้ประโยชน์จากความก้าวหน้า ในแมชชีนเลิร์นนิงด้วยโมเดลที่ได้รับการฝึกฝนข้อมูลมากกว่าหลายพันชั่วโมงเพื่อสร้างวิธีการใหม่ในการบีบอัดและส่งสัญญาณเสียง
รหัสของ Lyra เขียนด้วย C ++ เพื่อความเร็ว ประสิทธิภาพและความสามารถในการทำงานร่วมกันนอกจากนี้ยังใช้เฟรมเวิร์ก Bazel กับ Abseil และเฟรมเวิร์ก GoogleTest สำหรับการทดสอบแบบเต็มหน่วย
Basic API มีอินเทอร์เฟซสำหรับการเข้ารหัสและถอดรหัสในระดับแพ็กเก็ตและไฟล์ นอกจากนี้ยังมี Toolchain การประมวลผลสัญญาณที่สมบูรณ์และรวมถึงตัวกรองและการแปลงต่างๆ
“ แอปพลิเคชันตัวอย่างของเราทำงานร่วมกับ Android NDK เพื่อแสดงวิธีการรวมโค้ดเนทีฟของ Lyra เข้ากับแอปพลิเคชัน Android ที่ใช้ Java นอกจากนี้เรายังให้น้ำหนักเวกเตอร์และตัวระบุปริมาณที่จำเป็นในการเรียกใช้ Lyra ด้วย” Google กล่าว รุ่นนี้มีเครื่องมือที่จำเป็นสำหรับนักพัฒนาในการเข้ารหัสและถอดรหัสเสียงด้วย Lyra ซึ่งเหมาะสำหรับแพลตฟอร์ม Android ARM 64 บิตพร้อมเวอร์ชันสำหรับ Linux
คุณลักษณะต่างๆจะถูกถอดรหัสเป็นรูปคลื่นโดยใช้แบบจำลองการกำเนิด Generative Models เป็นโมเดลแมชชีนเลิร์นนิงชนิดพิเศษที่เหมาะอย่างยิ่งสำหรับการสร้างรูปคลื่นเสียงที่สมบูรณ์จากฟังก์ชันจำนวน จำกัด
สถาปัตยกรรมของ Lyra คล้ายกับตัวแปลงสัญญาณเสียงแบบดั้งเดิมมากซึ่งเป็นหัวใจสำคัญของการสื่อสารทางอินเทอร์เน็ตมานานหลายทศวรรษ ในขณะที่ตัวแปลงสัญญาณแบบดั้งเดิมเหล่านี้ใช้เทคนิคการประมวลผลสัญญาณดิจิทัล Lyra อยู่ในความสามารถของโมเดลกำเนิดในการสร้างสัญญาณเสียงคุณภาพสูงขึ้นมาใหม่
Google ใช้ Lyra ในแอปวิดีโอคอล Duo ฟรีและบอกว่ากำลังสร้างโค้ดแบบโอเพ่นซอร์สเพราะคิดว่ามันอาจจะเหมาะกับแอพอื่น ๆ
Google เชื่อว่ามีแอปจำนวนมากที่ Lyra อาจเหมาะสำหรับการเก็บเสียงจำนวนมากการประหยัดแบตเตอรี่หรือลดความแออัดของเครือข่ายในสถานการณ์ที่วุ่นวาย
"เราหวังเป็นอย่างยิ่งว่าจะได้เห็นความคิดสร้างสรรค์ที่เป็นลักษณะเฉพาะของชุมชนโอเพ่นซอร์สที่นำไปใช้กับ Lyra เพื่อส่งมอบแอปพลิเคชันที่มีประสิทธิภาพและไม่เหมือนใคร" Google กล่าว
Fuente: https://opensource.googleblog.com