LinuxでドキュメントをスキャンしてOCRを適用する方法

UbuntuのデフォルトプログラムであるSimpleScanを試しましたが、OCRなどをサポートしていないことに失望しましたか? 同時に、XSANEは、あなたが始めた単純なタスクには複雑すぎますか? Omnipageでドキュメントをスキャンするのがいかに簡単であったかを見逃していますか?

まあ、不思議ではありません... OCRをスキャンして実行する方法を見てみましょう スキャンされたドキュメントで非常に簡単な方法で。 あなたは結果に驚かれることでしょう.

2つの簡単なステップでスキャンする方法

1.- インストール gscan2pdf & テッセラクト-ocr (それぞれの言語パックと一緒に)。 つまり、英語でドキュメントをスキャンする場合は、をインストールします。 tesseract-ocr-eng; スペイン語の場合は、インストールします tesseract-ocr-eng など。

sudo apt-get install gscan2pdf tesseract-ocr tesseract-ocr-eng

2.- 残りは、WindowsでドキュメントをスキャンしてOCRedしたことがある人にとっては非常に簡単です。 私は開きました gscan2pdf、ドキュメントをスキャンし、に移動します オプション> OCR 選択します Tesseract OCRエンジンとして。 他のエンジンもありますが、Tesseractは群を抜いて最高のパフォーマンスを発揮するエンジンです。 最後に、最終的なドキュメントをPDF、DJVUなどとして保存できます。 に行く ファイル>保存.

注:スキャンしたドキュメントを保存する場合は、DJVU形式で保存することをお勧めします(品質はPDFと同じですが、サイズに非常に重要な違いがあります)。

次のビデオは英語ですが、すべてがどのように機能するかを理解するには、それを見るだけで十分です。


コメントを残す

あなたのメールアドレスが公開されることはありません。 必須フィールドには付いています *

*

*

  1. データの責任者:MiguelÁngelGatón
  2. データの目的:SPAMの制御、コメント管理。
  3. 正当化:あなたの同意
  4. データの伝達:法的義務がある場合を除き、データが第三者に伝達されることはありません。
  5. データストレージ:Occentus Networks(EU)がホストするデータベース
  6. 権利:いつでも情報を制限、回復、削除できます。

  1.   匿名の

    アレックス:多くのゲーマーは、好きな女の子と「友達をゾーン分け」するのに問題があります。
    混乱したメリッサに彼はウォルドではないと説明した後、
    しかし、ホン・ルドビック・ワトソン、彼女は行くことに同意します
    イングランド。 あなたの質問も十分に単純である必要があります
    彼女が何も考えずに応答するために。

    これが私のウェブブログです- バダスレビューのタオ

  2.   バチタックス

    パッケージはFedoraでも利用できることに注意してください。 🙂

  3.   チャペル

    私は5000つのスキャナーを持っています。4つはA2ドキュメント用のCanonScan XNUMXfで、もうXNUMXつはネガとスライドをスキャンするためのBraunNovoScanです。 gscanXNUMXユーティリティをインストールして再起動した後、スキャナーは表示されません。 どうした? スキャナーが見えないのはなぜですか?

  4.   Linuxを使いましょう

    不快な友達はいませんが、数学関数をOCRすることには意味がありません。

    いずれにせよ、周囲のテキスト(それらの機能などを説明する)をOCRし、機能を画像として残すと便利です。
    乾杯! ポール。

  5.   NotFromブルックリン

    ねえ、あなたがあなたの問題の解決策を思いついたなら、私は知りたいです。

  6.   フアンヴァレホ

    少し遅れていると思いますが、質問があります。 私は工学部の学生で、メモをデジタル化してクリーンアップする方法を探していますが、問題は、それらのメモのほとんどが数学的な記号、グラフ、および関数でいっぱいであるということです。 現在、私を助けることができる何かがありますか?

  7.   Linuxを使いましょう

    すごい! 良い日! Arch Tesseractでは、公式リポジトリにありますが、gscan2pdfにはありません。 yaourtからインストールする必要があります。

  8.   エルカリマン13142

    どうもありがとうございました。Linuxをよりフレンドリーな優雅さにしてください。

  9.   Linuxを使いましょう

    どういたしまして! お役に立てて光栄です。
    ハグ! ポール。

  10.   マーティン

    私はそれを探していたのでとても良かったです、私は試してみて、これがどうなっているのかを教えます。

  11.   マウロニコラスイバニェスジラール

    ありがとう、やってみます!

  12.   レオナルド・エルナンデス

    Tesseractエンジンを使用してOCRを実行すると、tesseract-ocr-spaパッケージをインストールした場合でも、英語でのプロセスのオプションしか表示されません。 私は何ができますか?

  13.   ハイメとイザベル

    gnscaner2pdfをダウンロードしますが、スキャンしません。デバイスを検索するだけで、デバイスを検索しません。15分後も検索を続けます。 調子はどう?