Одна из наиболее распространенных задач журналистов, блоггеров или писателей в целом - это перевод того, что говорится в интервью, записи и любых аудиозаписях, в которых они говорят на определенную тему, в текст. Это довольно сложное занятие, которое включает в себя прослушивание, запоминание, расшифровку, переход по дорожке назад, продвижение вперед, уточнение звука для фокусировки голосов и т. Д., Чтобы сделать это занятие немного проще, родился игрок Gnome по имени Parlatype.
Что такое Парлатип?
Парлатип это простой аудиоплеер, который позволяет нам вручную преобразовывать звук в текст простым и очень эффективным способом. Он разработан с использованием языка C и отлично работает в среде рабочего стола GNOME.
Простота инструмента позволяет ему работать на любом компьютере, потребление ресурсов минимально, простота использования невероятна, а его команда разработчиков постоянно обновляет инструмент.
Parlatype Особенности
Приложение имеет ряд функций, которые помогают сделать преобразование голоса в текст более или менее эффективным, выделяя следующие функции:
- Он имеет интерфейс, который позволяет нам визуализировать волны рассматриваемого звука, выделяя паузы, точки и голоса, это позволяет нам транскрибировать звук после пробелов в звуке.
- Вы можете настроить скорость воспроизведения звука в соответствии со своими предпочтениями.
- Одна из особенностей, которая мне больше всего нравится в этом инструменте, заключается в том, что каждый раз, когда мы приостанавливаем воспроизведение звука, он возвращается на несколько секунд назад, что позволяет нам не терять нить транскрипции при ее повторном воспроизведении. (вы можете настроить эту опцию).
- Parlatype имеет отличную интеграцию с LibreOffice, поэтому любители этого офисного пакета будут иметь гораздо больше функций, однако мы можем использовать любой офисный пакет при расшифровке.
- Он имеет отличную совместимость с большинством текущих аудиоформатов, так как оснащен фреймворком GStreamer.
- Интеграция с мультимедийными ключами.
- Настраиваемый интерфейс.
- Поддержка нескольких языков.
- Большое сообщество разработчиков и очень подробная документация.
- Бесплатный и открытый исходный код.
Как установить Parlatype?
Parlatype имеет официальную поддержку Ubuntu и производных дистрибутивов, установка довольно проста, нам просто нужно установить PPA инструмента, а затем установить приложение с помощью следующих команд:
$ Sudo add-apt-repository ppa: gabor-karsay / parlatype $ sudo apt-get update и & sudo apt install parlatype
Наконец запустите инструмент и начните наслаждаться.
Пользователи других дистрибутивов могут попробовать Parlatype, выполнив установку из его исходного кода, для этого выполните следующие команды:
$ git clone https://github.com/gkarsay/parlatype.git
$ cd parlatype
$ ./autogen.sh --prefix=/usr --disable-introspection
$ make
$ sudo make install
При попытке установить PPA появляется следующее сообщение: «Этот PPA не поддерживает xenial».
Очевидно, я не смогу наслаждаться Parlatype на моем Mint 18.1.
Позор
ppa дает много проблем, лучше скомпилируйте его, этот совет я даю вам, потому что ваш друг, папай, я ...
sudo apt-get install build-essential automake autoconf intltool libgirepository1.0-dev libgladeui-dev gtk-doc-tools yelp-tools libgtk-3-dev libgstreamer1.0-dev libgstreamer-plugins-base1.0-dev libgtk-3- 0 libgstreamer1.0-0 gstreamer1.0-plugins-хорошо
Wget https://github.com/gkarsay/parlatype/releases/download/v1.5.1/parlatype-1.5.1.tar.gz
tar -zxvf parlatype-1.5.1.tar.gz
cd parlatype- *
автореконф
./configure –prefix = / usr –disable-introspection
Я предпочитаю префикс в ~ / .local
сделать
sudo сделать установку чистой
и удалить:
cd parlatype *
сделать удаление
Спасибо, что поделились этим программным обеспечением.
Читая заголовок в RSS, я ожидал, что он сам перейдет от голоса к тексту, и вам нужно будет только исправить ошибки.
Использование Julius, CMI Sphinx, Open Mind Speech, Vox Forge или даже Google
В свое время я пытался использовать это программное обеспечение, и оно было очень громоздким и ничего не продуктивным, в настоящее время вы можете диктовать браузеру Google или его приложению для работы с документами, и оно неплохо пишет вам, даже с планшета или мобильного телефона, но я думаю, что это касается сделать (и я думал, что об этом) apk, который конвертирует ваши записи в текст или в настольное приложение.
https://github.com/katchsvartanian/voiceRecognition
Используйте Google API для преобразования речи в текст из файлов FLAC.
В поисках программ распознавания голоса из аудиофайла, вызванных чтением этой статьи, кажется, что не было сделано большого прогресса с тех пор, как я заинтересовался этой темой много лет назад, за исключением этой иголки в стоге сена, которой я делюсь, потому что было трудно найти что-то новое.