Kako skenirati dokumente i primijeniti OCR u Linuxu

Jeste li isprobali Simple Scan, zadani Ubuntu program, ali bili ste razočarani kad ste vidjeli da ne podržava OCR itd.? Je li istovremeno XSANE prekompliciran za jednostavan zadatak koji ste si zadali? Nedostaje li vam koliko je lako bilo skenirati dokumente pomoću Omnipagea?

Pa, nije ni čudo ... da vidimo kako skenirati i izvesti OCR u skeniranim dokumentima na vrlo, vrlo jednostavan način. Zapanjit ćete se rezultatima.

Kako skenirati u 2 jednostavna koraka

1. - instalirati gscan2pdf & teserakt-okr (zajedno s odgovarajućim jezičnim paketom). Odnosno, u slučaju da ćete skenirati dokumente na engleskom, instalirajte teseract-ocr-eng; Ako su na španjolskom, instalirajte teserakt-ocr-spa i tako.

sudo apt-get instalirati gscan2pdf tesseract-ocr tesseract-ocr-spa

2. - Ostalo je prilično jednostavno za one od vas koji ste ikada skenirali i OCR dokument u sustavu Windows. otvorio sam gscan2pdf, skenirajte dokument, idite na Opcije> OCR i odaberite Teserakt kao OCR motor. Postoje i drugi motori, ali Tesseract je daleko najučinkovitiji motor. Konačno, konačni dokument možete spremiti u PDF, DJVU itd. idem Datoteka> Spremi.

Napomena: prilikom spremanja skeniranih dokumenata bolje ih je spremiti u formatu DJVU (kvaliteta je ista kao i PDF, ali postoji vrlo važna razlika u veličini).

Sljedeći je video na engleskom jeziku, ali dovoljno je da ga vidite da biste razumjeli kako sve funkcionira.


Ostavite svoj komentar

Vaša email adresa neće biti objavljen. Obavezna polja su označena s *

*

*

  1. Za podatke odgovoran: Miguel Ángel Gatón
  2. Svrha podataka: Kontrola neželjene pošte, upravljanje komentarima.
  3. Legitimacija: Vaš pristanak
  4. Komunikacija podataka: Podaci se neće dostavljati trećim stranama, osim po zakonskoj obvezi.
  5. Pohrana podataka: Baza podataka koju hostira Occentus Networks (EU)
  6. Prava: U bilo kojem trenutku možete ograničiti, oporaviti i izbrisati svoje podatke.

  1.   anoniman dijo

    Alex: Mnogi igrači imaju problem dobiti "prijatelja na zoni" s djevojkama koje im se sviđaju.
    Nakon što je zbunjenoj Melissi objasnio da on nije Waldo,
    ali Hon Ludovick Watson, ona pristaje otići
    Engleska. Vaše pitanje također mora biti dovoljno JEDNOSTAVNO
    da ona odgovori bez ijedne tone razmišljanja.

    Evo mog web bloga - Tao iz pregleda Badass

  2.   bachitux dijo

    Primijetite da su paketi dostupni i u Fedori. 🙂

  3.   kapela dijo

    Imam dva skenera, jedan je Canon Scan 5000f za A4 dokumente, a drugi je Braun NovoScan, za skeniranje negativa i dijapozitiva. Nakon instalacije uslužnog programa gscan2 i ponovnog pokretanja, ne vidite nijedan skener. što se dogodilo? Zašto ne vidite skenere?

  4.   Koristimo Linux dijo

    Bez uvrede prijatelji, ali nema smisla OCRing matematičke funkcije.

    U svakom slučaju, trebali bi napraviti OCR okolnom tekstu (koji objašnjava te funkcije ili što već) i da funkcije ostanu kao slike.
    Živjeli! Pavao.

  5.   Nije iz Brooklyna dijo

    Hej, ako si smislio rješenje svog problema, volio bih znati.

  6.   Juan Vallejo dijo

    Mislim da malo kasnim, ali imam pitanje. Student sam inženjerstva i tražim način za digitalizaciju i čišćenje bilješki, ali problem je u tome što je većina tih bilješki puna matematičkih simbola, grafikona i funkcija. Postoji li trenutno nešto što mi može pomoći?

  7.   Koristimo Linux dijo

    Sjajno! Dobar spoj! U Arch Tesseractu nalazi se u službenim spremištima, ali ne i u gscan2pdf. Morate ga instalirati putem vašeg računala.

  8.   elcaliman13142 dijo

    Puno vam hvala, puno mi je pomoglo, opet čine linux ugodnijom milošću

  9.   Koristimo Linux dijo

    Molim! Zadovoljstvo mi je što sam mogao pomoći.
    Zagrljaj! Pavao.

  10.   bregunica dijo

    Vrlo dobro, tražio sam to, pokušat ću i reći ću kako to ide.

  11.   Mauro Nicolas Ybanez Girard dijo

    Hvala, pokušat ću!

  12.   Leonard Hernandez dijo

    Kad idem pokretati OCR s Tesseract motorom, to mi daje samo mogućnost postupka na engleskom, iako sam instalirao tesseract-ocr-spa paket. Što ja mogu učiniti?

  13.   Jaime i Isabel dijo

    preuzmite gnscaner2pdf, ali ne skenira, već samo traži uređaje i ne prestaje tražiti nakon 15 minuta. Što ima?