Cómo escanear documentos y aplicar OCR en Linux

Cara mengimbas dokumen dan menggunakan OCR di Linux

Sudahkah anda mencuba Simple Scan, program Ubuntu lalai, tetapi kecewa kerana tidak menyokong OCR, dll? Pada masa yang sama, adakah XSANE terlalu rumit untuk tugas mudah yang anda ingin lakukan? Adakah anda terlepas betapa mudahnya mengimbas dokumen dengan Omnipage?

Tidak hairanlah ... mari kita lihat cara mengimbas dan melakukan OCR dalam dokumen yang diimbas dengan cara yang sangat mudah. Anda akan kagum dengan hasilnya.

Cara mengimbas dalam 2 langkah mudah

1.- memasang gscan2pdf & tesseract-ocr (bersama dengan paket bahasa masing-masing). Sekiranya anda akan mengimbas dokumen dalam bahasa Inggeris, pasang tesseract-ocr-eng; Sekiranya mereka menggunakan bahasa Sepanyol, pasang tesseract-ocr-eng dan juga.

sudo apt-get install gscan2pdf tesseract-ocr tesseract-ocr-eng

2.- Selebihnya cukup mudah bagi anda yang pernah mengimbas dan OCR dokumen di Windows. Saya buka gscan2pdf, imbas dokumen, pergi ke Pilihan> OCR dan pilih Tesseract sebagai enjin OCR. Terdapat enjin lain, tetapi sejauh ini Tesseract adalah enjin berkinerja terbaik. Akhirnya, anda boleh menyimpan dokumen akhir sebagai PDF, DJVU, dll. pergi ke Fail> Simpan.

Catatan: semasa menyimpan dokumen yang diimbas, lebih baik menyimpannya dalam format DJVU (kualitinya sama dengan PDF tetapi ada perbezaan ukuran yang sangat penting).

Video berikut adalah dalam bahasa Inggeris tetapi cukup untuk melihatnya untuk memahami bagaimana semuanya berfungsi.

Tinggalkan komen anda Batal balasan

Anonymous kata
membuat 11 tahun

Alex: Ramai pemain mempunyai masalah untuk mendapatkan «rakan dizonkan» dengan gadis yang mereka sukai.
Setelah menjelaskan kepada Melissa yang bingung bahawa dia bukan Waldo,
tetapi Yang Berhormat Ludovick Watson, dia bersetuju untuk pergi
Inggeris. Soalan anda juga perlu cukup mudah
untuk dia bertindak balas tanpa berfikir banyak.

Inilah blog web saya - Ulasan Tao of Badass

Balas kepada Tanpa Nama
bachitux kata
membuat 11 tahun

Perhatikan bahawa pakej juga terdapat di Fedora. 🙂

Balas BachiTux
kapel kata
membuat 11 tahun

Saya mempunyai dua pengimbas, satu adalah Canon Scan 5000f untuk dokumen A4, dan yang lain adalah Braun NovoScan, untuk mengimbas negatif dan slaid. Setelah memasang utiliti gscan2, dan reboot, anda tidak melihat pengimbas apa pun. apa yang berlaku? Mengapa anda tidak melihat pengimbas?

Balas chapela
Mari gunakan Linux kata
membuat 11 tahun

Tidak ada kesalahan rakan, tetapi tidak ada gunanya fungsi matematik OCRing.

Walau apa pun, mereka harus melakukan OCR pada teks di sekitarnya (yang menjelaskan fungsi-fungsi tersebut atau apa sahaja) dan fungsinya tetap seperti gambar.
Ceria! Paul.

Balas Mari Menggunakan Linux
BukanDariBrooklyn kata
membuat 11 tahun

Hai, jika anda telah menemui penyelesaian untuk masalah anda, saya ingin tahu.

Balas ke NotFromBrooklyn
Juan Vallejo kata
membuat 11 tahun

Saya fikir saya agak terlambat tetapi saya mempunyai soalan. Saya seorang pelajar kejuruteraan dan saya mencari cara untuk mendigitalkan dan membersihkan nota saya, tetapi masalahnya ialah kebanyakan nota itu penuh dengan simbol, grafik, dan fungsi matematik. Adakah terdapat sesuatu yang dapat menolong saya?

Balas Juan Vallejo
Mari gunakan Linux kata
membuat 11 tahun

Hebat! Selamat bertarikh! Di Arch Tesseract ia berada di repositori rasmi, tetapi tidak di gscan2pdf. Anda mesti memasangnya melalui yaourt.

Balas Mari Menggunakan Linux
elkaliman13142 kata
membuat 11 tahun

Terima kasih banyak ia banyak membantu saya, mereka menjadikan rahmat linux lebih mesra lagi

Balas Elcaliman13142
Mari gunakan Linux kata
membuat 11 tahun

Sama-sama! Senang dapat menolong.
Pelukan! Paul.

Balas Mari Menggunakan Linux
Martin kata
membuat 11 tahun

Sangat baik saya mencarinya, saya akan mencuba dan saya akan memberitahu bagaimana keadaannya.

Balas Martin
Mauro Nicolas Ybanez Girard kata
membuat 11 tahun

Terima kasih, saya akan cuba!

Balas Mauro Nicolás Ybáñez Girard
Leonard Hernandez kata
membuat 10 tahun

Apabila saya menjalankan OCR dengan mesin Tesseract, ia hanya memberi saya pilihan proses dalam bahasa Inggeris walaupun saya memasang pakej tesseract-ocr-spa. Apa boleh saya buat?

Balas Leonardo Hernandez
jaime dan isabel kata
membuat 5 tahun

Muat turun gnscaner2pdf tetapi tidak mengimbas, ia hanya mencari peranti dan bukan untuk itu, ia terus mencari setelah 15 minit. Apa khabar?

Balas jaime dan isabel