Una de las tareas más comunes que tienen los periodistas, bloggers o escritores en general es el de llevar a texto lo dicho en una entrevista, grabación y cualquier audio en el que se hable referente a un tema. Esta es una actividad un poco compleja que conlleva ir escuchando, memorizando, transcribiendo, retrocediendo la pista, adelantando, aclarando los audios para enfocar las voces, etc, para hacer esta actividad un poco más sencilla nace un reproductor para Gnome llamado Parlatype.
¿Qué es Parlatype?
Parlatype es un sencillo reproductor de audio que nos permite transcribir de manera manual un audio a texto de manera sencilla y muy eficiente, esta desarrollado utilizando el lenguaje C y funciona perfectamente en el entorno de escritorio de GNOME.
La simplicidad de la herramienta permite que se ejecute en cualquier ordenador, el consumo de recursos es mínimo, la facilidad de uso es increíble y su equipo de desarrollo actualiza constantemente la herramienta.
Características de Parlatype
La aplicación cuenta con una serie de características que ayuda a que la transcripción de voz a texto sea más a menos, destacando las siguientes funcionalidades:
- Cuenta con una interfaz que nos permite vizualizar las ondas del audio en cuestión, destacando las pausas, puntos y las voces, esto nos permite ir transcribiendo el audio siguiendo los vacíos del audio.
- Se puede ajustar la velocidad de reproducción del audio según nuestras preferencias.
- Una de las funcionalidades que más me agrada de esta herramienta es que cada vez que hacemos pausa al audio este retrocede unos segundos, los que nos permite no perder el hilo de la transcripción cuando se vuelva a dar a reproducir. (se puede ajustar esta opción).
- Parlatype tiene una excelente integración con LibreOffice por lo que los amantes de esta suite ofimática tendrán muchas más prestaciones, sin embargo, podemos hacer uso de cualquier suite ofimática a la hora de transcribir.
- Posee una gran compatibilidad con la mayoría de los formatos de audio actuales, ya que viene equipado con el framework GStreamer.
- Integración con las teclas multimedias.
- Interfaz ajustable.
- Soporte para múltiples idiomas.
- Una amplia comunidad de desarrollo y una documentación muy detallada.
- Libre y de código abierto.
¿Cómo instalar Parlatype?
Parlatype cuenta con soporte oficial para Ubuntu y las distros derivadas, la instalación es bastante sencilla, basta con que instalemos el PPA de la herramienta y luego instalemos la aplicación con los siguientes comandos:
$Sudo add-apt-repository ppa: gabor-karsay / parlatype $Sudo apt-get update y & sudo apt install parlatype
Por último ejecute la herramienta y comience a disfrutar.
Los usuarios de otras distros pueden probar Parlatype siguiendo la instalación desde su código fuente para ello ejecute los siguientes comandos:
$ git clone https://github.com/gkarsay/parlatype.git
$ cd parlatype
$ ./autogen.sh --prefix=/usr --disable-introspection
$ make
$ sudo make install
Al intentar instalar el PPA, aparece el siguiente mensaje: ‘Este PPA no soporta xenial’.
Obviamente, no podré disfrutar Parlatype en mi Mint 18.1
Una pena.
la ppa da muchos problemas,mejor compilenlo,este consejo te doy por que tu amigo popeye soy …..
sudo apt-get install build-essential automake autoconf intltool libgirepository1.0-dev libgladeui-dev gtk-doc-tools yelp-tools libgtk-3-dev libgstreamer1.0-dev libgstreamer-plugins-base1.0-dev libgtk-3-0 libgstreamer1.0-0 gstreamer1.0-plugins-good
wget https://github.com/gkarsay/parlatype/releases/download/v1.5.1/parlatype-1.5.1.tar.gz
tar -zxvf parlatype-1.5.1.tar.gz
cd parlatype-*
autoreconf
./configure –prefix=/usr –disable-introspection
yo prefiero el prefix en ~/.local
make
sudo make install clean
y para desinstalar :
cd parlatype*
make uninstall
Gracias por dar a conocer este software.
Al leer el titular en el RSS me esperaba que pasase de voz a texto el solito y que solo tuvieses que corregir errores.
Haciendo uso de Julius, CMI Sphinx, Open Mind Speech, Vox Forge, o incluso de Google
En su día intenté usar este software y fue muy engorroso, y nada productivo, hoy en día le puedes dictar al navegador de google o a su aplicación de documentos y te lo escribe bastante bien, incluso desde una tableta o móvil, pero creo que está por hacer (y creía que iba de eso) una apk que te pasase a texto tus grabaciones o una aplicación de sobremesa.
https://github.com/katchsvartanian/voiceRecognition
Usa la API de Google de voz a texto desde archivos FLAC.
Buscando programas de reconocimiento de voz desde archivo de audio, ocasionado por la lectura de este artículo, parece que no se ha avanzado mucho desde que hace años me interesé por el tema, a excepción de esta aguja en el pajar, que comparto porque mucho me ha costado encontrar algo novedoso.