Como converter TXT a WAV, MP3, OGG, AAC ou FLAC en Ubuntu

Converter ficheiros de texto en audio é algo que pode ser útil non só para persoas con problemas de visión, senón tamén para calquera que queren estudar ou aqueles que, sendo preguiceiros para ler ou carecendo do espazo mínimo de confort para facelo, gozan de ser "lidos" para eles mentres están no tren, no metro, etc.Por fin poderás gardar os teus libros favoritos, resumos da facu, etc. no teu reprodutor de música. e poderás levalos contigo onde queiras.

O método que che vou ensinar esta vez usa o motor espeak. Basicamente hai 2 xeitos de usalo a través dunha GUI (altofalante) ou a través dun terminal.


Pasos anteriores:

Espeak xa está instalado nas últimas versións de Ubuntu, por iso o eliximos. Polo tanto, o que queda por instalar e configurar é moi pouco.

Usando a GUI de Gespeaker

1) Instalar Gespeaker:
Ir á páxina oficial do proxecto, descarga o paquete .DEB e instalalo.

Unha vez instalado, busque e execute Gespeaker, dispoñible en Aplicacións> Audio e vídeo> Gespeaker

Cando o executes entenderás que o seu uso é moi intuitivo. Só tes que escoller a voz coa que queremos reproducir o texto; no noso caso, podería ser español ou español-latinoamericano. A continuación, escribe o texto no cadro de texto principal e, se é necesario, configura as opcións "avanzadas" que regulan a velocidade, o volume, o ton e o "atraso" entre as palabras da voz. Finalmente, preme Reproducir e voila.

Para gardar este texto nun ficheiro de audio, só tes que premer "Gravar" e escoller o camiño de destino.

2) Instalar voces Mbrola

Pode que te decatas de que as voces orixinais soan algo "robóticas", ao estilo de "Stephen Hawking". Para "solucionar" este problema, unha posible solución é empregar as voces de Mbrola.

Para iso, primeiro temos que instalar o motor Mbrola. Abra o terminal e escriba:

sudo apt-get install mbrola

Entón baixa as voces de Mbrola «Es1» e «es2» (se o desexa tamén pode descargar outros), descomprimir e copiar só os ficheiros do mesmo nome e sen extensión ao cartafol «/ usr / share / mbrola», que debemos crear se o fai non existe.

Para facer todo iso moi rápido desde o terminal, copia e pega todo este millo:

wget http://www.tcts.fpms.ac.be/synthesis/mbrola/dba/es1/es1-980610.zip && wget http://www.tcts.fpms.ac.be/synthesis/mbrola/dba/ es2 / es2-989825.zip && descomprimir es1-980610.zip && descomprimir es2-989825.zip && sudo mkdir / usr / share / mbrola && sudo cp ~ / es1 / es1 / usr / share / mbrola && sudo cp ~ / es2 / es2 / usr / share / mbrola

3) Afinación Gespeaker

Antes de continuar, recoméndolle pechar Gespeaker se o tiña aberto. Volve abrilo e vai a Editar> Preferencias. No reprodutor de audio, poden escoller entre ALSA e PulseAudio. A miña recomendación é que escolla "PulseAudio". Todo o demais pode seguir igual.

Só queda ver se Gespeaker detectou correctamente o motor e as voces de Mbrola. Para iso, vaia á pestana "Voces de Mbrola". Onde di "Aplicación principal de Mbrola" debería aparecer unha mensaxe dicindo "Paquete mbrola instalado". A continuación, desprácese ata o final da lista para ver se detectou as voces "spanish-mbrola-1" e "spanish-mbrola-2". Se é así, imos polo bo camiño.

4) Proba de todo ...

Finalmente, selecciona as voces de Mbrola en Gespeaker. Na xanela principal do programa, escolla na lista «Idioma» o elemento «Spanish-mbrola-1» ou «Spanish-mbrola-2».

Usando o terminal

1) Aprender a usar Espeak desde o terminal

Reproduce o texto introducido:

espeak --stdout 'Usemos Linux é o máis' | xogar

Reproduce o texto mentres o escribe no terminal:

espeak --stdout | xogar

reproducir un documento

espeak --stdout -t mydocument.txt | xogar

Reproduce un documento e xera un ficheiro WAV

fale -t mydocument.txt -w myudio.wav

Enumera todas as voces dispoñibles

falar --vocestexto

Xogar usando unha "voz" específica

espeak -v en-uk --stdout 'Usemos Linux é o mellor blog do mundo' | xogar

Define o número de palabras por minuto reproducidas

espeak -s 140 -f mydocument.txt | xogar

Enumera as voces dispoñibles nun idioma concreto

espeak --voice = es

2) Instalar voces Mbrola

Para iso, deben seguir os mesmos pasos desenvolvidos no punto 2 anterior.

Use as voces Mbrola desde o terminal.

Isto pode ser un pouco máis engorroso, pero funcionou mellor para min que Gespeaker. Aínda que o motor de conversión é o mesmo (espeak + mbrola), a voz de Gspeaker soou peor, probablemente porque o atraso entre palabras non se pode reducir a un número inferior a 5. Polo tanto, recoméndoche que gardes esta páxina en favoritos para acceder a ela en tempos de necesidade.

Para converter un ficheiro de texto a un ficheiro .WAV usando as voces de Mbrola:

espeak -v mb-es1 -f ficheiro de texto | mbrola -e / usr / share / mbrola / es1 - output.wav

Para reproducir simplemente un ficheiro de texto usando as voces Mbrola:

espeak -v mb-es1 -f ficheiro de texto | mbrola -e / usr / share / mbrola / es1 - - | aplay -r16000 -fS16

O parámetro -e impide que mbrola pare se atopa fonemas que non entende ou recoñece correctamente.

Aínda que este non é o caso de "es1" e "es2", é importante ter en conta que algunhas voces mbrola usan unha frecuencia de mostraxe de 22050 Hz. Neste caso, deberían poñer -r22050 en lugar de -r16000.

Como converter o resultado final (.WAV) a .MP3, .OGG, etc.

O método máis sinxelo é empregar Sound Converter, unha GUI para bibliotecas gstreamer.

Abre un terminal e introduce:

sudo apt-get install soundconverter

Despois vai a Aplicacións> Audio e Vídeo> Conversor de son e executa o programa. Para configurar os parámetros de conversión vai a Editar> Preferencias. A continuación, seleccione os ficheiros que desexa converter e prema o botón «Converter»


O contido do artigo adhírese aos nosos principios de ética editorial. Para informar dun erro faga clic en aquí.

5 comentarios, deixa os teus

Deixa o teu comentario

Enderezo de correo electrónico non será publicado. Os campos obrigatorios están marcados con *

*

*

  1. Responsable dos datos: Miguel Ángel Gatón
  2. Finalidade dos datos: controlar SPAM, xestión de comentarios.
  3. Lexitimación: o seu consentimento
  4. Comunicación dos datos: os datos non serán comunicados a terceiros salvo obrigación legal.
  5. Almacenamento de datos: base de datos aloxada por Occentus Networks (UE)
  6. Dereitos: en calquera momento pode limitar, recuperar e eliminar a súa información.

  1.   imos usar linux dixo

    Boa cita! Grazas Facundo!

  2.   Facundo Peiretti dixo

    Moi ben !!
    Pero gustaríame aclarar unha pregunta: para instalar as outras voces de Mbrola tiven que colocar TODO o contido do .zip no cartafol / usr / share / mbrola, xa que doutro xeito (ao pegar só o ficheiro sen unha extensión) o programa díxome q que "idioma" non estaba instalado.

  3.   Helena dixo

    Moi ben, seguro que lle dou moito uso. Grazas.

  4.   Edwina dixo

    Excelente contribución, moitas grazas.

  5.   Daniel Esteban Buccafusca dixo

    Bos días e seguín todos os pasos, incluído instalar o gespeaker por terminal pero este programa non se executa, o espeaker, desde o terminal podes escoitalo.