Whisper: Gratis automatisk talegenkendelsessystem

Whisper: Gratis automatisk talegenkendelsessystem

Whisper: Gratis automatisk talegenkendelsessystem

I perioden 2020 – 2022 er Blockchain og DeFi teknologier hovedsageligt ledet af kryptovalutaer, fangede de meget af opmærksomheden på det teknologiske område. Især på hjemmesider relateret til gratis og åbne teknologier, da mange af dem blev genereret fra denne base.

Og med dem håber vi, med tiden, et spring eller en stigning i anvendeligheden af ​​vores GNU/Linux-operativsystemer takket være flere gratis applikationer og platforme, men også mere decentraliserede og sikre. Selvom der den dag i dag er sket nogle fremskridt på det. Men, nu ganske muligt, for de næste 3 år eller mere, er tendensen brugen af Kunstig intelligens (AI) teknologier. Teknologier, der meget sikkert som ChatGPT, Sydney, Bard, Opkald og andre som, Hviske, vil de have mulighed for at nå det samme mål.

OpenAI: Kunstig intelligensprojekter gratis og åbne for alle

Men før du starter dette indlæg om "Hvisker", et gratis automatisk talegenkendelsessystem, anbefaler vi, at du senere udforsker tidligere relateret indlæg:

OpenAI: Kunstig intelligensprojekter gratis og åbne for alle
relateret artikel:
OpenAI: Kunstig intelligensprojekter gratis og åbne for alle

Whisper: Open Source + AI + ASR

Whisper: Open Source + AI + ASR

Hvad er Whispers?

Sikkert, mange kender allerede GPT teknologi (Generativ Pre-trained Transformer på engelsk, eller Spansk Generativ Pretrained Transformer) fra OpenAI. som er en kunstig intelligens model, der gør det muligt at generere skriftsprog gennem brugen af ​​en autoregressiv sprogmodel, det vil sige en algoritme, der tillader skabelsen af ​​det næstbedste ord, der ville følge en given tekst. Og at det er blevet ekstremt berømt takket være ChatGPT.

ChatGPT er et udviklet open source Natural Language Processing (NLP) system designet til at generere menneskelignende samtaler fra inputtekst. Derfor er det meget brugt i forskellige applikationer og platforme, for blandt andet at opnå chatbots, naturlig sprogforståelse (NLU) og automatiseret kundeservice.

Imidlertid OpenAI har mange flere AI-projekter, blandt hvilke skiller sig ud "Hvisker". Som ifølge sin officielle hjemmeside beskrives som et open source-projekt, der giver en alsidig talegenkendelsesmodel der kan transskribere, identificere og oversætte flere sprog.

Hviske er et automatisk talegenkendelsessystem (ASR) trænet på 680.000 timers overvågede flersprogede og multitasking-data indsamlet fra nettet. Vi viser, at brug af et så stort og forskelligartet datasæt forbedrer robustheden over for accenter, baggrundsstøj og teknisk sprog. Hviske præsentation

Mens i hans officiel sektion på GitHub, tilføj flere detaljer om det som følger:

Hviske Det er en talegenkendelsesmodel til generelle formål. Den er trænet på et stort forskelligartet lyddatasæt og er også en multitasking-model, der kan udføre flersproget talegenkendelse samt taleoversættelse og sprogidentifikation.

Hvisk en talegenkendelsesmodel til generelle formål
relateret artikel:
De udgav kildekoden til Whisper, et automatisk talegenkendelsessystem

Hvad kan denne AI-teknologi bringe til operativsystemer?

Hvad kan denne AI-teknologi bringe til operativsystemer?

Såvel som, ChatGPT Den er kommet for at blive og hjælpe med opgaver som mere præcise og venlige søgninger på internettet; generere, opsummere og oversætte tekster; og holde samtaler eller hjælpe folk med forskellige behov, alt sammen ved at indtaste tekst. Hviske det kan nemt bidrage til de samme opgaver ører og mund, som kan være så nødvendige for at gøre opgaven med at gøre alt dette ved hjælp af en mus og et tastatur meget mere venlig.

Derfor både i Linux og i andre Desktop og mobile operativsystemer, kunne vi snart se en ny generation af AI-applikationer, med et ekstremt avanceret interaktionsniveau, som sagtens kunne undvære manuel tekstinput. Med andre ord kunne de lytte, forstå og reagere på deres samtalepartner gennem en mikrofon og horn.

Derfor ville det ikke være usædvanligt, hvis man i det næste årti kl tænd din computer med GNU/Linux, er den første ting, der vises på skærmen ansigtet (GUI) af en AI, giver os en velkomsthilsen og spørger os, hvad vi vil gøre, for selv at åbne applikationerne og begynde at udføre de anmodede kommandoer.

Såsom: At udføre en internetsøgning, tage en diktat for at skrive et dokument, åbne et billed- eller videoredigeringsprogram for at oprette eller uploade en fil, der skal ændres, blandt mange flere.

Endelig kan Whisper pt installeret på Linux og Windows eller testet online på nettet af OpenAI Legeplads. Selvom der er interessante værktøjer, der allerede bruger denne teknologi, er 2 gode eksempler følgende: Whisper Typer Tool y Tale Oversæt.

Artificial Intelligence Projects 2023: Gratis, gratis og åben
relateret artikel:
Artificial Intelligence Projects 2023: Gratis, gratis og åben

Roundup: Bannerpost 2021

Resumé

Kort sagt, lad os håbe, at alle disse nye kunstig intelligens-teknologier tilgængelige og under opbygning, især dem, der har en fri og åben oprindelse, basis eller licensering, som f.eks ChatGPT og OpenAI Whisper, bidrage til mange positive ting for menneskeheden. Men frem for alt, så vores nuværende gratis og åbne operativsystemer kan fortsætte med at forbedre brugervenlighed og tilgængelighed ved at have meget mere avancerede og venlige apps og funktioner til enhver type bruger.

Hvis du kunne lide dette indlæg, stop ikke med at dele det med andre på dine websteder, kanaler, grupper eller foretrukne fællesskaber af sociale netværk eller beskedsystemer. Og husk endelig besøg vores hjemmeside at udforske flere nyheder, ud over at blive medlem af vores officielle kanal af Fra Linux Telegram, Vest gruppe for mere information om dagens emne.


Efterlad din kommentar

Din e-mailadresse vil ikke blive offentliggjort. Obligatoriske felter er markeret med *

*

*

  1. Ansvarlig for dataene: Miguel Ángel Gatón
  2. Formålet med dataene: Control SPAM, management af kommentarer.
  3. Legitimering: Dit samtykke
  4. Kommunikation af dataene: Dataene vil ikke blive kommunikeret til tredjemand, undtagen ved juridisk forpligtelse.
  5. Datalagring: Database hostet af Occentus Networks (EU)
  6. Rettigheder: Du kan til enhver tid begrænse, gendanne og slette dine oplysninger.