Cara mengimbas dokumen dan menggunakan OCR di Linux

Sudahkah anda mencuba Simple Scan, program Ubuntu lalai, tetapi kecewa kerana tidak menyokong OCR, dll? Pada masa yang sama, adakah XSANE terlalu rumit untuk tugas mudah yang anda ingin lakukan? Adakah anda terlepas betapa mudahnya mengimbas dokumen dengan Omnipage?

Tidak hairanlah ... mari kita lihat cara mengimbas dan melakukan OCR dalam dokumen yang diimbas dengan cara yang sangat mudah. Anda akan kagum dengan hasilnya.

Cara mengimbas dalam 2 langkah mudah

1.- memasang gscan2pdf & tesseract-ocr (bersama dengan paket bahasa masing-masing). Sekiranya anda akan mengimbas dokumen dalam bahasa Inggeris, pasang tesseract-ocr-eng; Sekiranya mereka menggunakan bahasa Sepanyol, pasang tesseract-ocr-eng dan juga.

sudo apt-get install gscan2pdf tesseract-ocr tesseract-ocr-eng

2.- Selebihnya cukup mudah bagi anda yang pernah mengimbas dan OCR dokumen di Windows. Saya buka gscan2pdf, imbas dokumen, pergi ke Pilihan> OCR dan pilih Tesseract sebagai enjin OCR. Terdapat enjin lain, tetapi sejauh ini Tesseract adalah enjin berkinerja terbaik. Akhirnya, anda boleh menyimpan dokumen akhir sebagai PDF, DJVU, dll. pergi ke Fail> Simpan.

Catatan: semasa menyimpan dokumen yang diimbas, lebih baik menyimpannya dalam format DJVU (kualitinya sama dengan PDF tetapi ada perbezaan ukuran yang sangat penting).

Video berikut adalah dalam bahasa Inggeris tetapi cukup untuk melihatnya untuk memahami bagaimana semuanya berfungsi.


Tinggalkan komen anda

Alamat email anda tidak akan disiarkan. Ruangan yang diperlukan ditanda dengan *

*

*

  1. Bertanggungjawab atas data: Miguel Ángel Gatón
  2. Tujuan data: Mengendalikan SPAM, pengurusan komen.
  3. Perundangan: Persetujuan anda
  4. Komunikasi data: Data tidak akan disampaikan kepada pihak ketiga kecuali dengan kewajiban hukum.
  5. Penyimpanan data: Pangkalan data yang dihoskan oleh Occentus Networks (EU)
  6. Hak: Pada bila-bila masa anda boleh menghadkan, memulihkan dan menghapus maklumat anda.

  1.   Anonymous kata

    Alex: Ramai pemain mempunyai masalah untuk mendapatkan «rakan dizonkan» dengan gadis yang mereka sukai.
    Setelah menjelaskan kepada Melissa yang bingung bahawa dia bukan Waldo,
    tetapi Yang Berhormat Ludovick Watson, dia bersetuju untuk pergi
    Inggeris. Soalan anda juga perlu cukup mudah
    untuk dia bertindak balas tanpa berfikir banyak.

    Inilah blog web saya - Ulasan Tao of Badass

  2.   bachitux kata

    Perhatikan bahawa pakej juga terdapat di Fedora. 🙂

  3.   kapel kata

    Saya mempunyai dua pengimbas, satu adalah Canon Scan 5000f untuk dokumen A4, dan yang lain adalah Braun NovoScan, untuk mengimbas negatif dan slaid. Setelah memasang utiliti gscan2, dan reboot, anda tidak melihat pengimbas apa pun. apa yang berlaku? Mengapa anda tidak melihat pengimbas?

  4.   Mari gunakan Linux kata

    Tidak ada kesalahan rakan, tetapi tidak ada gunanya fungsi matematik OCRing.

    Walau apa pun, mereka harus melakukan OCR pada teks di sekitarnya (yang menjelaskan fungsi-fungsi tersebut atau apa sahaja) dan fungsinya tetap seperti gambar.
    Ceria! Paul.

  5.   BukanDariBrooklyn kata

    Hai, jika anda telah menemui penyelesaian untuk masalah anda, saya ingin tahu.

  6.   Juan Vallejo kata

    Saya fikir saya agak terlambat tetapi saya mempunyai soalan. Saya seorang pelajar kejuruteraan dan saya mencari cara untuk mendigitalkan dan membersihkan nota saya, tetapi masalahnya ialah kebanyakan nota itu penuh dengan simbol, grafik, dan fungsi matematik. Adakah terdapat sesuatu yang dapat menolong saya?

  7.   Mari gunakan Linux kata

    Hebat! Selamat bertarikh! Di Arch Tesseract ia berada di repositori rasmi, tetapi tidak di gscan2pdf. Anda mesti memasangnya melalui yaourt.

  8.   elkaliman13142 kata

    Terima kasih banyak ia banyak membantu saya, mereka menjadikan rahmat linux lebih mesra lagi

  9.   Mari gunakan Linux kata

    Sama-sama! Senang dapat menolong.
    Pelukan! Paul.

  10.   Martin kata

    Sangat baik saya mencarinya, saya akan mencuba dan saya akan memberitahu bagaimana keadaannya.

  11.   Mauro Nicolas Ybanez Girard kata

    Terima kasih, saya akan cuba!

  12.   Leonard Hernandez kata

    Apabila saya menjalankan OCR dengan mesin Tesseract, ia hanya memberi saya pilihan proses dalam bahasa Inggeris walaupun saya memasang pakej tesseract-ocr-spa. Apa boleh saya buat?

  13.   jaime dan isabel kata

    Muat turun gnscaner2pdf tetapi tidak mengimbas, ia hanya mencari peranti dan bukan untuk itu, ia terus mencari setelah 15 minit. Apa khabar?