ジャーナリスト、ブロガー、またはライターが一般的に行う最も一般的なタスクのXNUMXつは、インタビュー、録音、およびトピックについて話している音声をテキストに翻訳することです。 これは、聞く、暗記する、書き写す、トラックを逆行する、進む、音声を明確にして声に焦点を合わせるなど、やや複雑なアクティビティであり、このアクティビティを少し簡単にするために、Parlatypeと呼ばれるGnomeプレーヤーが誕生します。
Parlatypeとは何ですか?
パーラタイプ は、シンプルで非常に効率的な方法で音声をテキストに手動で書き写すことができるシンプルなオーディオプレーヤーです。C言語を使用して開発されており、GNOMEデスクトップ環境で完全に機能します。
ツールのシンプルさにより、どのコンピューターでも実行でき、リソースの消費は最小限に抑えられ、使いやすさは驚くべきものであり、開発チームはツールを常に更新しています。
パーラタイプの機能
このアプリケーションには、音声からテキストへの文字起こしを多かれ少なかれ行うのに役立つ一連の機能があり、次の機能が強調されています。
- 問題のオーディオの波を視覚化し、一時停止、ポイント、音声を強調表示できるインターフェイスがあります。これにより、オーディオのギャップに続いてオーディオを書き写すことができます。
- 好みに応じてオーディオの再生速度を調整できます。
- このツールで私が最も気に入っている機能のXNUMXつは、オーディオを一時停止するたびに数秒戻ることです。これにより、再生時に文字起こしのスレッドが失われることはありません。 ((このオプションを調整できます).
- ParlatypeはLibreOfficeとの優れた統合性を備えているため、このオフィススイートの愛好家にはさらに多くの機能がありますが、文字起こしの際にはどのオフィススイートでも使用できます。
- GStreamerフレームワークが搭載されているため、現在のほとんどのオーディオ形式との互換性が高くなっています。
- マルチメディアキーとの統合。
- 調整可能なインターフェース。
- 複数の言語のサポート。
- 大規模な開発コミュニティと非常に詳細なドキュメント。
- 無料でオープンソース。
Parlatypeをインストールするにはどうすればいいですか?
ParlatypeはUbuntuと派生ディストリビューションを公式にサポートしており、インストールは非常に簡単です。ツールのPPAをインストールしてから、次のコマンドを使用してアプリケーションをインストールするだけです。
$ Sudo add-apt-repository ppa:gabor-karsay / parlatype $ sudo apt-get update and&sudo apt install parlatype
最後にツールを実行して楽しみ始めます。
他のディストリビューションのユーザーは、ソースコードからのインストールに従ってParlatypeを試すことができます。そのためには、次のコマンドを実行します。
$ git clone https://github.com/gkarsay/parlatype.git
$ cd parlatype
$ ./autogen.sh --prefix=/usr --disable-introspection
$ make
$ sudo make install
PPAをインストールしようとすると、次のメッセージが表示されます。 'このPPAはxenialをサポートしていません'。
もちろん、ミント18.1ではParlatypeを楽しむことができません。
恥ずべき
ppaは多くの問題を引き起こします、それをよりよくコンパイルします、あなたの友人のポパイが私であるために私があなたに与えるこのアドバイス…..
sudo apt-get install build-essential automake autoconf intltool libgirepository1.0-dev libgladeui-dev gtk-doc-tools yelp-tools libgtk-3-dev libgstreamer1.0-dev libgstreamer-plugins-base1.0-dev libgtk-3- 0 libgstreamer1.0-0gstreamer1.0-プラグイン-良い
wgetの https://github.com/gkarsay/parlatype/releases/download/v1.5.1/parlatype-1.5.1.tar.gz
tar -zxvf parlatype-1.5.1.tar.gz
cd parlatype- *
自動再設定
./configure –prefix = / usr –disable-introspection
〜/ .localのプレフィックスが好きです
make
sudo インストールをクリーンにします
およびアンインストールするには:
cdパーラタイプ*
アンインストールする
このソフトウェアを共有していただきありがとうございます。
RSSの見出しを読んだとき、それ自体が音声からテキストになり、エラーを修正するだけでよいと思っていました。
Julius、CMI Sphinx、Open Mind Speech、Vox Forge、さらにはGoogleを使用する
当時私はこのソフトウェアを使おうとしましたが、それは非常に面倒で生産的ではありませんでした。今日では、グーグルブラウザまたはそのドキュメントアプリケーションに口述することができ、タブレットやモバイルからでも非常にうまく書き込みますが、それはあなたの録音をテキストまたはデスクトップアプリケーションに変換するapkを作ることについてです(そして私はそれについてだと思いました)。
https://github.com/katchsvartanian/voiceRecognition
FLACファイルからテキストへの音声認識にはGoogleAPIを使用します。
この記事を読んだことで音声ファイルから音声認識プログラムを探していたところ、干し草の山にあるこの針を除いて、何年も前からこのテーマに興味を持ったので、あまり進歩していないようです。多くの場合、新しいものを見つけるのは困難でした。