Whisper: نظام التعرف التلقائي على الكلام المجاني
خلال الفترة 2020 - 2022 ، قام تقنيات Blockchain و DeFi بقيادة العملات المشفرة بشكل أساسي ، استحوذوا على الكثير من الاهتمام في المجال التكنولوجي. خاصة على مواقع الويب المتعلقة بـ تقنيات حرة ومفتوحة، حيث تم إنشاء العديد منهم من هذه القاعدة.
ومعهم ، نأمل ، في الوقت المناسب ، حدوث قفزة أو زيادة في قابلية استخدام أنظمة تشغيل GNU / Linux الخاصة بنا بفضل المزيد من التطبيقات والأنظمة المجانية ، ولكن أيضًا أكثر أمانًا ولامركزية. بينما ، حتى يومنا هذا ، تم إحراز بعض التقدم في ذلك. ولكن ، الآن ، من المحتمل جدًا ، خلال السنوات الثلاث المقبلة أو أكثر ، أن الاتجاه هو استخدام تقنيات الذكاء الاصطناعي. التقنيات التي ، بالتأكيد ChatGPT ، سيدني ، الشاعر, المكالمات وآخرين مثل ، همس، ستتاح لهم الفرصة لتحقيق نفس الهدف.

ولكن ، قبل البدء في هذا المنشور حول «همسات»، وهو نظام مجاني للتعرف على الكلام تلقائيًا ، نوصيك باستكشاف الوظيفة السابقة ذات الصلة:

Whisper: مفتوح المصدر + AI + ASR
ما هو Whispers؟
بالتأكيد ، يعرف الكثير بالفعل تقنية GPT (المحولات التوليدية المدربة مسبقًا باللغة الإنجليزية ، أو المحولات الاسبانية Generative Preetrained Transformer) من OpenAI. وهو نموذج ذكاء اصطناعي يسمح بتوليد لغة مكتوبة من خلال استخدام نموذج اللغة الانحدار التلقائي ، أي خوارزمية تسمح بإنشاء أفضل كلمة تالية تتبع نصًا معينًا. وقد أصبح مشهورًا للغاية بفضل ChatGPT.
شات جي بي تي هو نظام مطور مفتوح المصدر لمعالجة اللغة الطبيعية (NLP) مصمم لإنشاء محادثات تشبه الإنسان من إدخال نص. لذلك ، يتم استخدامه على نطاق واسع في العديد من التطبيقات والأنظمة الأساسية ، لتحقيق روبوتات المحادثة ، وفهم اللغة الطبيعية (NLU) وخدمة العملاء الآلية ، من بين أشياء أخرى كثيرة.
ومع ذلك، لدى OpenAI العديد من مشاريع الذكاء الاصطناعي، من بينها تبرز «همسات». والذي ، وفقًا لموقعه الرسمي على الإنترنت ، يوصف بأنه مشروع مفتوح المصدر يوفر ملف نموذج التعرف على الكلام متعدد الاستخدامات يمكنه نسخ وتحديد وترجمة لغات متعددة.
همس هو نظام التعرف التلقائي على الكلام (ASR) الذي تم تدريبه على 680.000 ساعة من البيانات متعددة اللغات والمتعددة المهام الخاضعة للإشراف والتي تم جمعها من الويب. نظهر أن استخدام مثل هذه المجموعة الكبيرة والمتنوعة من البيانات يحسن القوة ضد اللهجات والضوضاء الخلفية واللغة الفنية. عرض الهمس
بينما ، في بلده القسم الرسمي على جيثب، أضف المزيد من التفاصيل حوله كالتالي:
همس إنه نموذج التعرف على الكلام للأغراض العامة. يتم تدريبه على مجموعة بيانات صوتية متنوعة كبيرة وهو أيضًا نموذج متعدد المهام يمكنه إجراء التعرف على الكلام متعدد اللغات بالإضافة إلى ترجمة الكلام وتحديد اللغة.

ما الذي يمكن أن تقدمه تقنية الذكاء الاصطناعي هذه لأنظمة التشغيل؟
إلى جانب، شات جي بي تي لقد حان للبقاء والمساعدة في مهام مثل عمليات البحث الأكثر دقة وودية على الإنترنت ؛ توليد النصوص وتلخيصها وترجمتها ؛ وإجراء محادثات أو مساعدة الأشخاص ذوي الاحتياجات المختلفة ، كل ذلك عن طريق إدخال نص. همس يمكن أن يساهم بسهولة في نفس المهام التي يمكن أن تكون الأذنين والفم ضرورية للغاية لجعل مهمة القيام بكل هذا باستخدام الماوس ولوحة المفاتيح أكثر ملاءمة.
لذلك ، في كل من Linux وغيرها أنظمة تشغيل سطح المكتب والأجهزة المحمولة، يمكن أن نشهد قريبًا ملف جيل جديد من تطبيقات الذكاء الاصطناعي، بمستوى متقدم للغاية من التفاعل ، والذي يمكنه الاستغناء عن الإدخال اليدوي للنص. بمعنى آخر ، يمكنهم الاستماع إلى مستخدم المحاور الخاص بهم وفهمه والرد عليه ، من خلال ميكروفون وأبواق.
لذلك ، لن يكون من غير المألوف ، في العقد المقبل ، في قم بتشغيل جهاز الكمبيوتر الخاص بك باستخدام GNU / Linux، أول ما يظهر على الشاشة هو وجه (GUI) للذكاء الاصطناعي، يرحب بنا ويسألنا ماذا نريد أن نفعل ، لنفسها لفتح التطبيقات والبدء في تنفيذ الأوامر المطلوبة.
مثل: إجراء بحث على الإنترنت ، أو أخذ إملاء لكتابة مستند ، أو فتح محرر صورة أو فيديو لإنشاء أو تحميل ملف لتعديله ، من بين أشياء أخرى كثيرة.
أخيرًا ، يمكن أن يكون Whisper حاليًا مثبتًا على Linux و Windows أو تم اختباره عبر الإنترنت على الويب ملعب OpenAI. في حين أن هناك أدوات مثيرة للاهتمام تستخدم هذه التقنية بالفعل ، هناك مثالان جيدان على النحو التالي: أداة نوع الهمس y ترجمة الكلام.

ملخص
باختصار ، دعونا نأمل أن يكون كل هذا تقنيات الذكاء الاصطناعي الجديدة متوفر وقيد الإنشاء ، خاصة تلك التي لها أصل أو أساس أو ترخيص مجاني ومفتوح ، مثل ChatGPT و OpenAI Whisper، تساهم في العديد من الأشياء الإيجابية للإنسانية. ولكن ، قبل كل شيء ، حتى تتمكن أنظمة التشغيل الحالية المجانية والمفتوحة من الاستمرار في تحسين قابليتها للاستخدام وإمكانية الوصول ، من خلال وجود تطبيقات وميزات أكثر تقدمًا وودية لأي نوع من المستخدمين.
إذا أعجبك هذا المنشور ، لا تتوقف عن مشاركتها مع الآخرين على مواقع الويب أو القنوات أو المجموعات أو المجتمعات المفضلة للشبكات الاجتماعية أو أنظمة المراسلة. وأخيرا تذكر زرنا صفحة البداية لاستكشاف المزيد من الأخبار ، بالإضافة إلى الانضمام إلى قناتنا الرسمية من لينكس برقية، غرب مجموعة لمزيد من المعلومات حول موضوع اليوم.