Linux でドキュメントをスキャンして OCR を適用する方法

LinuxでドキュメントをスキャンしてOCRを適用する方法

UbuntuのデフォルトプログラムであるSimpleScanを試しましたが、OCRなどをサポートしていないことに失望しましたか？同時に、XSANEは、あなたが始めた単純なタスクには複雑すぎますか？ Omnipageでドキュメントをスキャンするのがいかに簡単であったかを見逃していますか？

まあ、不思議ではありません... OCRをスキャンして実行する方法を見てみましょう スキャンされたドキュメントで非常に簡単な方法で。 あなたは結果に驚かれることでしょう.

2つの簡単なステップでスキャンする方法

1.- インストール gscan2pdf & テッセラクト-ocr （それぞれの言語パックと一緒に）。つまり、英語でドキュメントをスキャンする場合は、をインストールします。 tesseract-ocr-eng; スペイン語の場合は、インストールします tesseract-ocr-eng など。

sudo apt-get install gscan2pdf tesseract-ocr tesseract-ocr-eng

2.- 残りは、WindowsでドキュメントをスキャンしてOCRedしたことがある人にとっては非常に簡単です。私は開きました gscan2pdf、ドキュメントをスキャンし、に移動します オプション> OCR 選択します Tesseract OCRエンジンとして。他のエンジンもありますが、Tesseractは群を抜いて最高のパフォーマンスを発揮するエンジンです。最後に、最終的なドキュメントをPDF、DJVUなどとして保存できます。に行く ファイル>保存.

注：スキャンしたドキュメントを保存する場合は、DJVU形式で保存することをお勧めします（品質はPDFと同じですが、サイズに非常に重要な違いがあります）。

次のビデオは英語ですが、すべてがどのように機能するかを理解するには、それを見るだけで十分です。

コメントを残す返信をキャンセル

匿名の同
HACE 11年

アレックス：多くのゲーマーは、好きな女の子と「友達をゾーン分け」するのに問題があります。
混乱したメリッサに彼はウォルドではないと説明した後、
しかし、ホン・ルドビック・ワトソン、彼女は行くことに同意します
イングランド。あなたの質問も十分に単純である必要があります
彼女が何も考えずに応答するために。

これが私のウェブブログです- バダスレビューのタオ

匿名に返信
バチタックス同
HACE 11年

パッケージはFedoraでも利用できることに注意してください。 🙂

BachiTuxに返信する
チャペル同
HACE 11年

私は5000つのスキャナーを持っています。4つはA2ドキュメント用のCanonScan XNUMXfで、もうXNUMXつはネガとスライドをスキャンするためのBraunNovoScanです。 gscanXNUMXユーティリティをインストールして再起動した後、スキャナーは表示されません。どうした？スキャナーが見えないのはなぜですか？

チャペラに返信
Linuxを使いましょう同
HACE 11年

不快な友達はいませんが、数学関数をOCRすることには意味がありません。

いずれにせよ、周囲のテキスト（それらの機能などを説明する）をOCRし、機能を画像として残すと便利です。
乾杯！ポール。

Linuxを使用しように応答する
NotFromブルックリン同
HACE 11年

ねえ、あなたがあなたの問題の解決策を思いついたなら、私は知りたいです。

NotFromBrooklynに返信する
フアンヴァレホ同
HACE 11年

少し遅れていると思いますが、質問があります。私は工学部の学生で、メモをデジタル化してクリーンアップする方法を探していますが、問題は、それらのメモのほとんどが数学的な記号、グラフ、および関数でいっぱいであるということです。現在、私を助けることができる何かがありますか？

JuanVallejoに返信する
Linuxを使いましょう同
HACE 11年

すごい！良い日！ Arch Tesseractでは、公式リポジトリにありますが、gscan2pdfにはありません。 yaourtからインストールする必要があります。

Linuxを使用しように応答する
エルカリマン13142 同
HACE 11年

どうもありがとうございました。Linuxをよりフレンドリーな優雅さにしてください。

Elcaliman13142に返信する
Linuxを使いましょう同
HACE 11年

どういたしまして！お役に立てて光栄です。
ハグ！ポール。

Linuxを使用しように応答する
マーティン同
HACE 11年

私はそれを探していたのでとても良かったです、私は試してみて、これがどうなっているのかを教えます。

マーティンに返信
マウロニコラスイバニェスジラール同
HACE 11年

ありがとう、やってみます！

MauroNicolásYbáñezGirardに返信する
レオナルド・エルナンデス同
HACE 10年

Tesseractエンジンを使用してOCRを実行すると、tesseract-ocr-spaパッケージをインストールした場合でも、英語でのプロセスのオプションしか表示されません。私は何ができますか？

LeonardoHernandezに返信する
ハイメとイザベル同
HACE 5年

gnscaner2pdfをダウンロードしますが、スキャンしません。デバイスを検索するだけで、デバイスを検索しません。15分後も検索を続けます。調子はどう？

jaimeとisabelに返信する

2つの簡単なステップでスキャンする方法

コメントを残す 返信をキャンセル

コメントを残す返信をキャンセル