Whisper: Sistem pengenalan suara otomatis gratis

Whisper: Sistem pengenalan suara otomatis gratis

Whisper: Sistem pengenalan suara otomatis gratis

Selama periode 2020 – 2022, the Teknologi Blockchain dan DeFi dipimpin terutama oleh cryptocurrency, mereka menarik banyak perhatian di bidang teknologi. Terutama pada website yang berhubungan dengan teknologi gratis dan terbuka, karena banyak dari mereka dihasilkan dari basis ini.

Dan dengan mereka, kami berharap, pada waktunya, lompatan atau peningkatan kegunaan sistem operasi GNU/Linux kami berkat lebih banyak aplikasi dan platform gratis, tetapi juga lebih terdesentralisasi dan aman. Sementara, hingga hari ini, beberapa kemajuan telah dibuat untuk itu. Tapi, sekarang sangat mungkin, untuk 3 tahun ke depan atau lebih, trennya adalah penggunaan Teknologi Kecerdasan Buatan (AI).. Teknologi itu, sangat pasti ChatGPT, Sydney, Penyair, Panggilan dan lain-lain seperti, Berbisik, mereka akan memiliki kesempatan untuk mencapai tujuan yang sama.

OpenAI: Proyek Kecerdasan Buatan gratis dan terbuka untuk semua

Tapi, sebelum memulai posting ini tentang «Berbisik», sistem pengenalan ucapan otomatis gratis, kami sarankan Anda menjelajahinya nanti posting terkait sebelumnya:

OpenAI: Proyek Kecerdasan Buatan gratis dan terbuka untuk semua
Artikel terkait:
OpenAI: Proyek Kecerdasan Buatan gratis dan terbuka untuk semua

Bisikan: Sumber Terbuka + AI + ASR

Bisikan: Sumber Terbuka + AI + ASR

Apa itu Bisikan?

Pasti banyak yang sudah tahu teknologi GPT (Transformer Pra-terlatih Generatif dalam bahasa Inggris, atau Transformer Pretrained Generatif Spanyol) dari OpenAI. yang mana model kecerdasan buatan yang memungkinkan untuk menghasilkan bahasa tertulis melalui penggunaan model bahasa auto-regresif, yaitu, algoritme yang memungkinkan pembuatan kata terbaik berikutnya yang akan mengikuti teks tertentu. Dan itu menjadi sangat terkenal berkat ChatGPT.

ChatGPT adalah sistem Natural Language Processing (NLP) sumber terbuka yang dikembangkan yang dirancang untuk menghasilkan percakapan seperti manusia dari teks masukan. Oleh karena itu, ini banyak digunakan di berbagai aplikasi dan platform, antara lain untuk mencapai chatbots, natural language understanding (NLU), dan layanan pelanggan otomatis.

Namun, OpenAI memiliki lebih banyak proyek AI, di antaranya menonjol «Berbisik». Yang menurut situs resminya, digambarkan sebagai proyek open source yang menyediakan a model pengenalan ucapan serbaguna yang dapat menyalin, mengidentifikasi, dan menerjemahkan berbagai bahasa.

Berbisik adalah sistem pengenalan suara otomatis (ASR) yang dilatih pada 680.000 jam data multibahasa dan multitugas yang diawasi yang dikumpulkan dari web. Kami menunjukkan bahwa menggunakan kumpulan data yang begitu besar dan beragam meningkatkan ketahanan terhadap aksen, kebisingan latar belakang, dan bahasa teknis. Presentasi Bisikan

Sedangkan di miliknya bagian resmi di GitHub, tambahkan detail lebih lanjut tentangnya sebagai berikut:

Berbisik Ini adalah model pengenalan suara tujuan umum. Ini dilatih pada kumpulan data audio besar yang beragam dan juga merupakan model multitasking yang dapat melakukan pengenalan ucapan multibahasa serta terjemahan ucapan dan identifikasi bahasa.

Bisikan model pengenalan ucapan tujuan umum
Artikel terkait:
Mereka merilis kode sumber Whisper, sistem pengenalan suara otomatis

Apa yang bisa dibawa oleh teknologi AI ini ke Sistem Operasi?

Apa yang bisa dibawa oleh teknologi AI ini ke Sistem Operasi?

Sebaik, ChatGPT Itu datang untuk tetap dan membantu dengan tugas-tugas seperti pencarian yang lebih tepat dan ramah di Internet; menghasilkan, meringkas dan menerjemahkan teks; dan mengadakan pembicaraan atau membantu orang dengan kebutuhan berbeda, semuanya dengan memasukkan teks. Berbisik itu dapat dengan mudah berkontribusi pada tugas yang sama telinga dan mulut yang bisa sangat diperlukan untuk membuat tugas melakukan semua ini menggunakan mouse dan keyboard jauh lebih ramah.

Oleh karena itu, baik di Linux maupun di lainnya Sistem Operasi Desktop dan Seluler, kita bisa segera melihat a aplikasi AI generasi baru, dengan tingkat interaksi yang sangat tinggi, yang dapat dengan mudah dilakukan tanpa input teks manual. Dengan kata lain, mereka dapat mendengarkan, memahami, dan menanggapi pengguna lawan bicara mereka, melalui mikrofon dan klakson.

Oleh karena itu, bukan hal yang aneh jika dalam dekade berikutnya, di nyalakan komputer Anda dengan GNU/Linux, hal pertama yang muncul di layar adalah wajah (GUI) AI, memberi kami salam selamat datang, dan menanyakan apa yang ingin kami lakukan, untuk dirinya sendiri membuka aplikasi dan mulai menjalankan perintah yang diminta.

Seperti: Melakukan pencarian di Internet, mendikte untuk menulis dokumen, membuka editor gambar atau video untuk membuat atau mengunggah file yang akan dimodifikasi, dan masih banyak lagi.

Terakhir, Whisper sekarang bisa diinstal di Linux dan Windows atau diuji secara online di web Taman Bermain OpenAI. Meskipun ada alat menarik yang sudah menggunakan teknologi ini, 2 contoh bagusnya adalah sebagai berikut: Alat Pengetik Bisikan y Pidato Terjemahkan.

Proyek Kecerdasan Buatan 2023: Gratis, gratis, dan terbuka
Artikel terkait:
Proyek Kecerdasan Buatan 2023: Gratis, gratis, dan terbuka

Roundup: Posting spanduk 2021

ringkasan

Singkatnya, mari kita berharap semua ini teknologi Kecerdasan Buatan baru tersedia dan sedang dibangun, terutama yang memiliki asal bebas dan terbuka, dasar atau lisensi, seperti ChatGPT dan OpenAI Whisper, berkontribusi banyak hal positif bagi kemanusiaan. Namun, yang terpenting, agar sistem operasi bebas dan terbuka kami saat ini dapat terus meningkatkan kegunaan dan aksesibilitas, dengan memiliki aplikasi dan fitur yang jauh lebih canggih dan ramah untuk semua jenis pengguna.

Jika Anda menyukai postingan ini, jangan berhenti berbagi dengan orang lain di situs web, saluran, grup, atau komunitas favorit jaringan sosial atau sistem perpesanan Anda. Dan terakhir, ingat Kunjungi kami beranda untuk menjelajahi lebih banyak berita, selain bergabung dengan saluran resmi kami Telegram dari DesdeLinux, Barat kelompok untuk informasi lebih lanjut tentang topik hari ini.


tinggalkan Komentar Anda

Alamat email Anda tidak akan dipublikasikan. Bidang yang harus diisi ditandai dengan *

*

*

  1. Penanggung jawab data: Miguel Ángel Gatón
  2. Tujuan data: Mengontrol SPAM, manajemen komentar.
  3. Legitimasi: Persetujuan Anda
  4. Komunikasi data: Data tidak akan dikomunikasikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Basis data dihosting oleh Occentus Networks (UE)
  6. Hak: Anda dapat membatasi, memulihkan, dan menghapus informasi Anda kapan saja.