Jeste li isprobali Simple Scan, zadani Ubuntu program, ali bili ste razočarani kad ste vidjeli da ne podržava OCR itd.? Je li istovremeno XSANE prekompliciran za jednostavan zadatak koji ste si zadali? Nedostaje li vam koliko je lako bilo skenirati dokumente pomoću Omnipagea?
Pa, nije ni čudo ... da vidimo kako skenirati i izvesti OCR u skeniranim dokumentima na vrlo, vrlo jednostavan način. Zapanjit ćete se rezultatima. |
Kako skenirati u 2 jednostavna koraka
1. - instalirati gscan2pdf & teserakt-okr (zajedno s odgovarajućim jezičnim paketom). Odnosno, u slučaju da ćete skenirati dokumente na engleskom, instalirajte teseract-ocr-eng; Ako su na španjolskom, instalirajte teserakt-ocr-spa i tako.
sudo apt-get instalirati gscan2pdf tesseract-ocr tesseract-ocr-spa
2. - Ostalo je prilično jednostavno za one od vas koji ste ikada skenirali i OCR dokument u sustavu Windows. otvorio sam gscan2pdf, skenirajte dokument, idite na Opcije> OCR i odaberite Teserakt kao OCR motor. Postoje i drugi motori, ali Tesseract je daleko najučinkovitiji motor. Konačno, konačni dokument možete spremiti u PDF, DJVU itd. idem Datoteka> Spremi.
Sljedeći je video na engleskom jeziku, ali dovoljno je da ga vidite da biste razumjeli kako sve funkcionira.
Alex: Mnogi igrači imaju problem dobiti "prijatelja na zoni" s djevojkama koje im se sviđaju.
Nakon što je zbunjenoj Melissi objasnio da on nije Waldo,
ali Hon Ludovick Watson, ona pristaje otići
Engleska. Vaše pitanje također mora biti dovoljno JEDNOSTAVNO
da ona odgovori bez ijedne tone razmišljanja.
Evo mog web bloga - Tao iz pregleda Badass
Primijetite da su paketi dostupni i u Fedori. 🙂
Imam dva skenera, jedan je Canon Scan 5000f za A4 dokumente, a drugi je Braun NovoScan, za skeniranje negativa i dijapozitiva. Nakon instalacije uslužnog programa gscan2 i ponovnog pokretanja, ne vidite nijedan skener. što se dogodilo? Zašto ne vidite skenere?
Bez uvrede prijatelji, ali nema smisla OCRing matematičke funkcije.
U svakom slučaju, trebali bi napraviti OCR okolnom tekstu (koji objašnjava te funkcije ili što već) i da funkcije ostanu kao slike.
Živjeli! Pavao.
Hej, ako si smislio rješenje svog problema, volio bih znati.
Mislim da malo kasnim, ali imam pitanje. Student sam inženjerstva i tražim način za digitalizaciju i čišćenje bilješki, ali problem je u tome što je većina tih bilješki puna matematičkih simbola, grafikona i funkcija. Postoji li trenutno nešto što mi može pomoći?
Sjajno! Dobar spoj! U Arch Tesseractu nalazi se u službenim spremištima, ali ne i u gscan2pdf. Morate ga instalirati putem vašeg računala.
Puno vam hvala, puno mi je pomoglo, opet čine linux ugodnijom milošću
Molim! Zadovoljstvo mi je što sam mogao pomoći.
Zagrljaj! Pavao.
Vrlo dobro, tražio sam to, pokušat ću i reći ću kako to ide.
Hvala, pokušat ću!
Kad idem pokretati OCR s Tesseract motorom, to mi daje samo mogućnost postupka na engleskom, iako sam instalirao tesseract-ocr-spa paket. Što ja mogu učiniti?
preuzmite gnscaner2pdf, ali ne skenira, već samo traži uređaje i ne prestaje tražiti nakon 15 minuta. Što ima?