Szept: Darmowy automatyczny system rozpoznawania mowy

Szept: Darmowy automatyczny system rozpoznawania mowy

Szept: Darmowy automatyczny system rozpoznawania mowy

W okresie 2020 – 2022 r Technologie Blockchain i DeFi prowadzone głównie przez kryptowaluty, przyciągnęły wiele uwagi w dziedzinie technologii. Zwłaszcza na stronach związanych z wolne i otwarte technologie, ponieważ wiele z nich zostało wygenerowanych z tej bazy.

A wraz z nimi spodziewamy się w odpowiednim czasie skoku lub zwiększenia użyteczności naszych systemów operacyjnych GNU/Linux dzięki większej liczbie darmowych aplikacji i platform, ale także bardziej zdecentralizowanej i bezpiecznej. Chociaż do dziś poczyniono w tym zakresie pewne postępy. Ale teraz całkiem możliwe, że przez następne 3 lata lub dłużej trendem jest używanie Technologie sztucznej inteligencji (AI).. Technologie, które z pewnością jako CzatGPT, Sydney, Bard, Lama a inni lubią Szept, będą mieli okazję osiągnąć ten sam cel.

OpenAI: projekty sztucznej inteligencji bezpłatne i otwarte dla wszystkich

Ale zanim zaczniesz ten post o "Szepty", darmowy system automatycznego rozpoznawania mowy, zalecamy późniejsze zapoznanie się z poprzedni powiązany post:

OpenAI: projekty sztucznej inteligencji bezpłatne i otwarte dla wszystkich
Podobne artykuł:
OpenAI: projekty sztucznej inteligencji bezpłatne i otwarte dla wszystkich

Szept: Open Source + AI + ASR

Szept: Open Source + AI + ASR

Co to jest szepty?

Z pewnością wielu już zna Technologia GPT (Generative Pre-trained Transformer w języku angielskim lub Hiszpański wstępnie przeszkolony transformator generatywny) z OpenAI. który jest model sztucznej inteligencji, który pozwala generować język pisany poprzez zastosowanie autoregresyjnego modelu językowego, czyli algorytmu pozwalającego na utworzenie kolejnego najlepszego słowa, które następowałoby po zadanym tekście. I że stał się niezwykle sławny dzięki ChatGPT.

ChatGPT to opracowany system przetwarzania języka naturalnego (NLP) o otwartym kodzie źródłowym, zaprojektowany do generowania konwersacji przypominających ludzkie z tekstu wejściowego. Dlatego jest szeroko stosowany w różnych aplikacjach i platformach, między innymi do tworzenia chatbotów, rozumienia języka naturalnego (NLU) i automatycznej obsługi klienta.

Jednak OpenAI ma o wiele więcej projektów AI, wśród których się wyróżnia "Szepty". Który, zgodnie z jego oficjalną stroną internetową, jest opisany jako projekt open source, który zapewnia wszechstronny model rozpoznawania mowy które mogą transkrybować, identyfikować i tłumaczyć wiele języków.

Szept to system automatycznego rozpoznawania mowy (ASR) przeszkolony na 680.000 XNUMX godzin nadzorowanych wielojęzycznych i wielozadaniowych danych zebranych z sieci. Pokazujemy, że użycie tak dużego i zróżnicowanego zestawu danych poprawia odporność na akcenty, hałas w tle i język techniczny. Prezentacja szeptem

Podczas gdy w jego oficjalna sekcja na GitHub, dodaj więcej szczegółów na ten temat w następujący sposób:

Szept Jest to model rozpoznawania mowy ogólnego przeznaczenia. Jest szkolony na dużym, zróżnicowanym zbiorze danych dźwiękowych, a także jest modelem wielozadaniowym, który może wykonywać wielojęzyczne rozpoznawanie mowy, a także tłumaczenie mowy i identyfikację języka.

Szepcz model rozpoznawania mowy ogólnego przeznaczenia
Podobne artykuł:
Wydali kod źródłowy Whisper, automatycznego systemu rozpoznawania mowy

Co ta technologia sztucznej inteligencji może wnieść do systemów operacyjnych?

Co ta technologia sztucznej inteligencji może wnieść do systemów operacyjnych?

Jak również, ChatGPT Przybył, aby zostać i pomóc w zadaniach, takich jak bardziej precyzyjne i przyjazne wyszukiwanie w Internecie; generować, streszczać i tłumaczyć teksty; i prowadź rozmowy lub pomagaj ludziom o różnych potrzebach, a wszystko to poprzez wprowadzanie tekstu. Szept może z łatwością przyczynić się do tych samych zadań za pomocą uszu i ust, które mogą być tak niezbędne, aby zadanie robienia tego wszystkiego za pomocą myszy i klawiatury było o wiele bardziej przyjazne.

Dlatego zarówno w Linuksie, jak iw innych Komputerowe i mobilne systemy operacyjne, wkrótce możemy zobaczyć a nowej generacji aplikacji AI, z niezwykle zaawansowanym poziomem interakcji, który z łatwością mógłby obejść się bez ręcznego wprowadzania tekstu. Innymi słowy, mogli słuchać, rozumieć i odpowiadać swojemu rozmówcy przez mikrofon i rogi.

Nie byłoby więc niczym niezwykłym, gdyby w następnej dekadzie o godz włącz komputer z systemem GNU/Linux, pierwszą rzeczą, która pojawia się na ekranie jest twarz (GUI) sztucznej inteligencji, witając nas i pytając, co chcemy zrobić, aby sama otworzyła aplikacje i zaczęła wykonywać żądane polecenia.

Na przykład: Wyszukiwanie w Internecie, dyktowanie w celu napisania dokumentu, otwieranie edytora obrazu lub wideo w celu utworzenia lub przesłania pliku do modyfikacji i wiele innych.

Wreszcie Whisper może być obecnie zainstalowany w systemach Linux i Windows lub przetestowane online w sieci Plac zabaw OpenAI. Chociaż istnieją interesujące narzędzia, które już korzystają z tej technologii, 2 dobre przykłady to: Narzędzie do pisania szeptem y Tłumacz mowy.

Projekty sztucznej inteligencji 2023: bezpłatne, bezpłatne i otwarte
Podobne artykuł:
Projekty sztucznej inteligencji 2023: bezpłatne, bezpłatne i otwarte

Podsumowanie: banner post 2021

streszczenie

Krótko mówiąc, miejmy nadzieję, że wszystkie te nowe technologie sztucznej inteligencji dostępne i w budowie, zwłaszcza te, które mają wolne i otwarte pochodzenie, podstawę lub licencję, takie jak ChatGPT i OpenAI Szept, przyczynić się do wielu pozytywnych rzeczy dla ludzkości. Ale przede wszystkim, aby nasze obecne bezpłatne i otwarte systemy operacyjne mogły nadal poprawiać użyteczność i dostępność dzięki znacznie bardziej zaawansowanym i przyjaznym aplikacjom i funkcjom dla każdego typu użytkownika.

Jeśli spodobał Ci się ten wpis, nie przestawaj dzielić się nim z innymi na twoich stronach internetowych, kanałach, grupach lub ulubionych społecznościach sieci społecznościowych lub systemach przesyłania wiadomości. I na koniec pamiętaj odwiedź nasz strona główna aby odkryć więcej wiadomości, oprócz dołączenia do naszego oficjalnego kanału Telegram z DesdeLinux, Zachód grupa aby uzyskać więcej informacji na dzisiejszy temat.


Zostaw swój komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

*

*

  1. Odpowiedzialny za dane: Miguel Ángel Gatón
  2. Cel danych: kontrola spamu, zarządzanie komentarzami.
  3. Legitymacja: Twoja zgoda
  4. Przekazywanie danych: Dane nie będą przekazywane stronom trzecim, z wyjątkiem obowiązku prawnego.
  5. Przechowywanie danych: baza danych hostowana przez Occentus Networks (UE)
  6. Prawa: w dowolnym momencie możesz ograniczyć, odzyskać i usunąć swoje dane.