Cómo escanear documentos y aplicar OCR en Linux

Hogyan szkennelhet dokumentumokat és hogyan alkalmazhatja az OCR-t Linux alatt

Próbálta már a Simple Scan-et, az alapértelmezett Ubuntu programot, de csalódottan látta, hogy nem támogatja az OCR-t stb.? Ugyanakkor az XSANE túl bonyolult az Ön által kitűzött egyszerű feladat elvégzéséhez? Hiányzik, milyen egyszerű volt a dokumentumok beolvasása az Omnipage segítségével?

Nos, nem csoda ... nézzük meg, hogyan kell beolvasni és végrehajtani az OCR-t a beolvasott dokumentumokba nagyon-nagyon egyszerű módon. Meg fog lepődni az eredményeken.

Szkennelés 2 egyszerű lépésben

1. - Telepítse gscan2pdf & tesseract-ocr (a megfelelő nyelvi csomaggal együtt). Vagyis abban az esetben, ha angol nyelvű dokumentumokat szeretne beolvasni, telepítse tesseract-ocr-eng; Ha spanyolul vannak, telepítse tesseract-ocr-eng és aztán.

sudo apt-get install gscan2pdf tesseract-ocr tesseract-ocr-eng

2. - A többi meglehetősen egyszerű azok számára, akik valaha is szkenneltek és OCR-dokumentumot készítettek a Windows rendszerben. kinyitottam gscan2pdf, beolvassa a dokumentumot, lépjen a következőre: Opciók> OCR és válassza ki Tesseract mint OCR motor. Vannak más motorok is, de a Tesseract messze a legjobban teljesítő motor. Végül elmentheti a végleges dokumentumot PDF, DJVU stb. Formátumban. fog Fájl> Mentés.

Megjegyzés: a beolvasott dokumentumok mentésekor jobb, ha DJVU formátumban menti őket (a minőség megegyezik a PDF minőségével, de nagyon fontos a méretbeli különbség).

A következő videó angol, de elég, ha megnézzük, hogy megértsük, hogyan működik minden.

Hagyja megjegyzését Mégsem válaszát

Névtelenül dijo
ezelőtt 11 év

Alex: Sok játékosnak problémája van, hogy «barátai zónába kerüljenek» olyan lányokkal, akiket szeretnek.
Miután elmagyarázta egy zavart Melissának, hogy ő nem Waldo,
de a Hon Ludovick Watson vállalja, hogy elmegy
Anglia. A kérdésének is elég egyszerûnek kell lennie
hogy rengeteg gondolkodás nélkül válaszoljon.

Itt a webblogom - Tao of Badass Review

Válasz Névtelen
bachitux dijo
ezelőtt 11 év

Vegye figyelembe, hogy a csomagok a Fedorában is elérhetők. 🙂

Válasz a BachiTux-nak
kápolna dijo
ezelőtt 11 év

Két szkennerem van, az egyik a Canon Scan 5000f A4-es dokumentumokhoz, a másik pedig a Braun NovoScan, negatívok és diák beolvasására. A gscan2 segédprogram telepítése és újraindítása után egyetlen szkennert sem lát. mi történt? Miért nem látja a szkennereket?

Válasz a kápolnára
Használjuk a Linuxot dijo
ezelőtt 11 év

Nincsenek sértő barátok, de nincs értelme az OCR matematikai függvényeinek elkészítésében.

Mindenesetre OCR-t kell tenniük a környező szöveggel (amely megmagyarázza ezeket a funkciókat vagy bármi mást), és hogy a funkciók képek maradjanak.
Egészségére! Pál.

Válaszoljon a Használjuk a Linuxot című cikkre
Nem Brooklynból dijo
ezelőtt 11 év

Hé, ha megoldást találtál a problémádra, szeretném tudni.

Válasz a NotFromBrooklyn címre
Juan Vallejo dijo
ezelőtt 11 év

Azt hiszem, kicsit elkéstem, de van egy kérdésem. Mérnökhallgató vagyok, és a jegyzeteim digitalizálásának és tisztításának módját keresem, de a probléma az, hogy a legtöbb ilyen jegyzet tele van matematikai szimbólumokkal, grafikonokkal és függvényekkel. Van valami, ami segíthet nekem?

Válasz Juan Vallejo-nak
Használjuk a Linuxot dijo
ezelőtt 11 év

Nagy! Jó randevú! Az Arch Tesseract-ban a hivatalos adattárakban található, de a gscan2pdf nem. Yaourt-on keresztül kell telepítenie.

Válaszoljon a Használjuk a Linuxot című cikkre
13142 dijo
ezelőtt 11 év

Köszönöm szépen, nagyon sokat segített nekem, ismét barátságosabbá teszik a linuxot

Válasz Elcaliman13142 címre
Használjuk a Linuxot dijo
ezelőtt 11 év

Szívesen! Öröm, hogy segíthettem.
Egy ölelés! Pál.

Válaszoljon a Használjuk a Linuxot című cikkre
Márton dijo
ezelőtt 11 év

Nagyon jó, kerestem, megpróbálom, és elmondom, hogy megy ez.

Válasz Martinnak
Mauro Nicolas Ybanez Girard dijo
ezelőtt 11 év

Köszönöm, megpróbálom!

Válasz Mauro Nicolás Ybáñez Girard-nak
Leonardo Hernandez dijo
ezelőtt 10 év

Amikor elmegyek futtatni az OCR-t a Tesseract motorral, az csak angol nyelven biztosítja a folyamat lehetőségét, annak ellenére, hogy telepítettem a tesseract-ocr-spa csomagot. Mit tudok tenni?

Válasz Leonardo Hernandeznek
jaime és isabel dijo
ezelőtt 5 év

Töltse le a gnscaner2pdf fájlt, de nem szkennel, csak eszközöket keres és nem, 15 perc után folytatja a keresést. Mi a helyzet?

Válasz jaime és isabel