Cara memindai dokumen dan menerapkan OCR di Linux

Apakah Anda mencoba Simple Scan, program default Ubuntu, tetapi kecewa karena program ini tidak mendukung OCR, dll.? Pada saat yang sama, apakah XSANE terlalu rumit untuk tugas sederhana yang ingin Anda lakukan? Apakah Anda merindukan betapa mudahnya memindai dokumen dengan Omnipage?

Tidak heran ... mari kita lihat cara memindai dan menjalankan OCR dalam dokumen yang dipindai dengan cara yang sangat, sangat sederhana. Anda akan kagum dengan hasilnya.

Cara memindai dalam 2 langkah sederhana

1. - Memasang gscan2pdf & tesseract-ocr (bersama dengan paket bahasanya masing-masing). Artinya, jika Anda akan memindai dokumen dalam bahasa Inggris, instal tesseract-ocr-eng; Jika mereka dalam bahasa Spanyol, instal tesseract-ocr-eng sehingga.

sudo apt-get install gscan2pdf tesseract-ocr tesseract-ocr-eng

2. - Selebihnya cukup mudah bagi mereka yang pernah memindai dan meng-OCR dokumen di Windows. Saya buka gscan2pdf, pindai dokumen, buka Pilihan> OCR dan pilih tesseract sebagai mesin OCR. Ada mesin lain, tetapi Tesseract sejauh ini merupakan mesin dengan performa terbaik. Terakhir, Anda dapat menyimpan dokumen akhir sebagai PDF, DJVU, dll. pergi ke File> Simpan.

Catatan: saat menyimpan dokumen yang dipindai, yang terbaik adalah menyimpannya dalam format DJVU (kualitasnya sama dengan PDF tetapi ada perbedaan ukuran yang sangat penting).

Video berikut ini dalam bahasa Inggris tetapi cukup melihatnya untuk memahami cara kerja semuanya.


tinggalkan Komentar Anda

Alamat email Anda tidak akan dipublikasikan. Bidang yang harus diisi ditandai dengan *

*

*

  1. Penanggung jawab data: Miguel Ángel Gatón
  2. Tujuan data: Mengontrol SPAM, manajemen komentar.
  3. Legitimasi: Persetujuan Anda
  4. Komunikasi data: Data tidak akan dikomunikasikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Basis data dihosting oleh Occentus Networks (UE)
  6. Hak: Anda dapat membatasi, memulihkan, dan menghapus informasi Anda kapan saja.

  1.   Anonim dijo

    Alex: Banyak pemain yang kesulitan «teman dikategorikan» dengan gadis yang mereka sukai.
    Setelah menjelaskan kepada Melissa yang bingung bahwa dia bukan Waldo,
    tapi The Hon Ludovick Watson, dia setuju untuk pergi
    Inggris. Pertanyaan Anda juga harus cukup SEDERHANA
    baginya untuk menanggapi tanpa berpikir panjang.

    Ini blog web saya - Ulasan Tao dari Badass

  2.   bachitux dijo

    Perhatikan bahwa paket tersebut juga tersedia di Fedora. 🙂

  3.   kapel dijo

    Saya memiliki dua pemindai, satu adalah Canon Scan 5000f untuk dokumen A4, dan yang lainnya adalah Braun NovoScan, untuk memindai negatif dan slide. Setelah menginstal utilitas gscan2, dan melakukan boot ulang, Anda tidak melihat pemindai apa pun. apa yang terjadi? Mengapa Anda tidak melihat pemindai?

  4.   Mari gunakan Linux dijo

    Jangan menyinggung teman, tetapi tidak ada gunanya fungsi matematika OCRing.

    Bagaimanapun, akan lebih mudah bagi mereka untuk meng-OCR teks di sekitarnya (yang menjelaskan fungsi-fungsi itu atau apa pun) dan bahwa fungsinya tetap sebagai gambar.
    Bersulang! Paul.

  5.   BukanDariBrooklyn dijo

    Hei, jika Anda telah menemukan solusi untuk masalah Anda, saya ingin tahu.

  6.   Juan Vallejo dijo

    Saya pikir saya agak terlambat tetapi saya punya pertanyaan. Saya seorang mahasiswa teknik dan saya sedang mencari cara untuk mendigitalkan dan membersihkan catatan saya, tetapi masalahnya adalah sebagian besar catatan tersebut penuh dengan simbol matematika, grafik, dan fungsi. Apakah saat ini ada sesuatu yang dapat membantu saya?

  7.   Mari gunakan Linux dijo

    Bagus! Kencan yang bagus! Di Arch Tesseract, ini ada di repositori resmi, tetapi bukan gscan2pdf. Anda harus menginstalnya melalui yaourt.

  8.   elcaliman13142 dijo

    Terima kasih banyak sudah banyak membantu saya, mereka membuat linux lebih ramah kasih karunia lagi

  9.   Mari gunakan Linux dijo

    Sama-sama! Senang sekali bisa membantu.
    Sebuah pelukan! Paul.

  10.   Martin dijo

    Sangat bagus saya mencarinya, saya akan mencoba dan saya akan menceritakan bagaimana kelanjutannya.

  11.   Mauro Nicolas Ybanez Girard dijo

    Terima kasih, saya akan mencoba!

  12.   Leonardo Hernandez dijo

    Ketika saya menjalankan OCR dengan mesin Tesseract, itu hanya memberi saya opsi proses dalam bahasa Inggris meskipun saya menginstal paket tesseract-ocr-spa. Apa yang saya bisa lakukan?

  13.   jaime dan isabel dijo

    unduh gnscaner2pdf tetapi tidak memindai, hanya mencari perangkat dan tidak berhenti mencari setelah 15 menit. Ada apa?