Una de les tasques més comunes que tenen els periodistes, blocaires o escriptors en general és el de portar a text el que s'ha dit en una entrevista, enregistrament i qualsevol àudio en què es parli referent a un tema. Aquesta és una activitat una mica complexa que comporta anar escoltant, memoritzant, transcrivint, retrocedint la pista, avançant, aclarint els àudios per enfocar les veus, etc, per fer aquesta activitat una mica més senzilla neix un reproductor per a Gnome anomenat Parlatype.
Què és Parlatype?
Parlatype és un senzill reproductor d'àudio que ens permet transcriure de manera manual un àudio a text de manera senzilla i molt eficient, desenvolupat utilitzant el llenguatge C i funciona perfectament a l'entorn d'escriptori del GNOME.
La simplicitat de l'eina permet que s'executi a qualsevol ordinador, el consum de recursos és mínim, la facilitat d'ús és increïble i el vostre equip de desenvolupament actualitza constantment l'eina.
Característiques de Parlatype
L'aplicació compta amb una sèrie de característiques que ajuda a fer que la transcripció de veu a text sigui més a menys, destacant les funcionalitats següents:
- Compte amb una interfície que ens permet vizualitzar les ones de l'àudio en qüestió, destacant les pauses, punts i les veus, això ens permet anar transcrivint l'àudio seguint els buits de l'àudio.
- Podeu ajustar la velocitat de reproducció de l'àudio segons les nostres preferències.
- Una de les funcionalitats que més m'agrada d'aquesta eina és que cada cop que fem pausa a l'àudio aquest retrocedeix uns segons, que ens permet no perdre el fil de la transcripció quan es torni a reproduir. (es pot ajustar aquesta opció).
- Parlatype té una excel·lent integració amb LibreOffice per la qual cosa els amants d'aquesta suite ofimàtica tindran moltes més prestacions, però podem fer ús de qualsevol suite ofimàtica a l'hora de transcriure.
- Posseeix una gran compatibilitat amb la majoria dels formats dàudio actuals, ja que ve equipat amb el framework GStreamer.
- Integració amb les tecles multimèdies.
- Interfície ajustable.
- Suport per a múltiples idiomes.
- Una àmplia comunitat de desenvolupament i una documentació molt detallada.
- Lliure i de codi obert.
Com instal·lar Parlatype?
Parlatype compta amb suport oficial per a Ubuntu i les distros derivades, la instal·lació és força senzilla, n'hi ha prou que instal·lem el PPA de l'eina i després instal·lem l'aplicació amb les següents ordres:
$Sudo add-apt-repository ppa: gabor-karsay / parlatype $Sudo apt-get update i & sudo apt install parlatype
Finalment executeu l'eina i comenceu a gaudir.
Els usuaris d'altres distros poden provar Parlatype seguint la instal·lació des del seu codi font per a això executeu les següents ordres:
$ git clone https://github.com/gkarsay/parlatype.git
$ cd parlatype
$ ./autogen.sh --prefix=/usr --disable-introspection
$ make
$ sudo make install
En intentar instal·lar el PPA, apareix el missatge següent: 'Aquest PPA no suporta xenial'.
Òbviament, no podré gaudir Parlatype al meu Mint 18.1
Una pena.
la ppa dóna molts problemes, millor compilin-ho, aquest consell et dono perquè el teu amic popeye sóc …..
sudo apt-get install build-essential automake autoconf intltool libgirepository1.0-dev libgladeui-dev gtk-doc-tools yelp-tools libgtk-3-dev libgstreamer1.0-dev libgstreamer-plugins-base1.0. 3 libgstreamer0-1.0 gstreamer0-plugins-good
wget https://github.com/gkarsay/parlatype/releases/download/v1.5.1/parlatype-1.5.1.tar.gz
tar -zxvf parlatype-1.5.1.tar.gz
cd parlatype-*
autoreconf
./configure –prefix=/usr –disable-introspection
jo prefereixo el prefix a ~/.local
fer
sudo make install clean
i per desinstal·lar :
cd parlatype*
fer desinstal·lar
Gràcies per donar a conèixer aquest programari.
En llegir el titular a l'RSS m'esperava que passés de veu a text el solet i que només haguessis de corregir errors.
Fent ús de Julius, CMI Sphinx, Open Mind Speech, Vox Forge, o fins i tot de Google
Al seu dia vaig intentar utilitzar aquest programari i va ser molt molest, i res productiu, avui en dia li pots dictar al navegador de google oa la seva aplicació de documents i t'ho escriu força bé, fins i tot des d'una tauleta o mòbil, però crec que està per fer (i creia que anava d'això) una apk que et passés a text les teves gravacions o una aplicació de sobretaula.
https://github.com/katchsvartanian/voiceRecognition
Fes servir l'API de Google de veu a text des de fitxers FLAC.
Buscant programes de reconeixement de veu des d'arxiu d'àudio, ocasionat per la lectura d'aquest article, sembla que no s'ha avançat gaire des que fa anys em vaig interessar pel tema, a excepció d'aquesta agulla al paller, que comparteixo perquè molt ha costat trobar alguna cosa nova.