Hogyan szkennelhet dokumentumokat és hogyan alkalmazhatja az OCR-t Linux alatt

Próbálta már a Simple Scan-et, az alapértelmezett Ubuntu programot, de csalódottan látta, hogy nem támogatja az OCR-t stb.? Ugyanakkor az XSANE túl bonyolult az Ön által kitűzött egyszerű feladat elvégzéséhez? Hiányzik, milyen egyszerű volt a dokumentumok beolvasása az Omnipage segítségével?

Nos, nem csoda ... nézzük meg, hogyan kell beolvasni és végrehajtani az OCR-t a beolvasott dokumentumokba nagyon-nagyon egyszerű módon. Meg fog lepődni az eredményeken.

Szkennelés 2 egyszerű lépésben

1. - Telepítse gscan2pdf & tesseract-ocr (a megfelelő nyelvi csomaggal együtt). Vagyis abban az esetben, ha angol nyelvű dokumentumokat szeretne beolvasni, telepítse tesseract-ocr-eng; Ha spanyolul vannak, telepítse tesseract-ocr-eng és aztán.

sudo apt-get install gscan2pdf tesseract-ocr tesseract-ocr-eng

2. - A többi meglehetősen egyszerű azok számára, akik valaha is szkenneltek és OCR-dokumentumot készítettek a Windows rendszerben. kinyitottam gscan2pdf, beolvassa a dokumentumot, lépjen a következőre: Opciók> OCR és válassza ki Tesseract mint OCR motor. Vannak más motorok is, de a Tesseract messze a legjobban teljesítő motor. Végül elmentheti a végleges dokumentumot PDF, DJVU stb. Formátumban. fog Fájl> Mentés.

Megjegyzés: a beolvasott dokumentumok mentésekor jobb, ha DJVU formátumban menti őket (a minőség megegyezik a PDF minőségével, de nagyon fontos a méretbeli különbség).

A következő videó angol, de elég, ha megnézzük, hogy megértsük, hogyan működik minden.


Hagyja megjegyzését

E-mail címed nem kerül nyilvánosságra. Kötelező mezők vannak jelölve *

*

*

  1. Az adatokért felelős: Miguel Ángel Gatón
  2. Az adatok célja: A SPAM ellenőrzése, a megjegyzések kezelése.
  3. Legitimáció: Az Ön beleegyezése
  4. Az adatok közlése: Az adatokat csak jogi kötelezettség alapján továbbítjuk harmadik felekkel.
  5. Adattárolás: Az Occentus Networks (EU) által üzemeltetett adatbázis
  6. Jogok: Bármikor korlátozhatja, helyreállíthatja és törölheti adatait.

  1.   Névtelenül dijo

    Alex: Sok játékosnak problémája van, hogy «barátai zónába kerüljenek» olyan lányokkal, akiket szeretnek.
    Miután elmagyarázta egy zavart Melissának, hogy ő nem Waldo,
    de a Hon Ludovick Watson vállalja, hogy elmegy
    Anglia. A kérdésének is elég egyszerûnek kell lennie
    hogy rengeteg gondolkodás nélkül válaszoljon.

    Itt a webblogom - Tao of Badass Review

  2.   bachitux dijo

    Vegye figyelembe, hogy a csomagok a Fedorában is elérhetők. 🙂

  3.   kápolna dijo

    Két szkennerem van, az egyik a Canon Scan 5000f A4-es dokumentumokhoz, a másik pedig a Braun NovoScan, negatívok és diák beolvasására. A gscan2 segédprogram telepítése és újraindítása után egyetlen szkennert sem lát. mi történt? Miért nem látja a szkennereket?

  4.   Használjuk a Linuxot dijo

    Nincsenek sértő barátok, de nincs értelme az OCR matematikai függvényeinek elkészítésében.

    Mindenesetre OCR-t kell tenniük a környező szöveggel (amely megmagyarázza ezeket a funkciókat vagy bármi mást), és hogy a funkciók képek maradjanak.
    Egészségére! Pál.

  5.   Nem Brooklynból dijo

    Hé, ha megoldást találtál a problémádra, szeretném tudni.

  6.   Juan Vallejo dijo

    Azt hiszem, kicsit elkéstem, de van egy kérdésem. Mérnökhallgató vagyok, és a jegyzeteim digitalizálásának és tisztításának módját keresem, de a probléma az, hogy a legtöbb ilyen jegyzet tele van matematikai szimbólumokkal, grafikonokkal és függvényekkel. Van valami, ami segíthet nekem?

  7.   Használjuk a Linuxot dijo

    Nagy! Jó randevú! Az Arch Tesseract-ban a hivatalos adattárakban található, de a gscan2pdf nem. Yaourt-on keresztül kell telepítenie.

  8.   13142 dijo

    Köszönöm szépen, nagyon sokat segített nekem, ismét barátságosabbá teszik a linuxot

  9.   Használjuk a Linuxot dijo

    Szívesen! Öröm, hogy segíthettem.
    Egy ölelés! Pál.

  10.   Márton dijo

    Nagyon jó, kerestem, megpróbálom, és elmondom, hogy megy ez.

  11.   Mauro Nicolas Ybanez Girard dijo

    Köszönöm, megpróbálom!

  12.   Leonardo Hernandez dijo

    Amikor elmegyek futtatni az OCR-t a Tesseract motorral, az csak angol nyelven biztosítja a folyamat lehetőségét, annak ellenére, hogy telepítettem a tesseract-ocr-spa csomagot. Mit tudok tenni?

  13.   jaime és isabel dijo

    Töltse le a gnscaner2pdf fájlt, de nem szkennel, csak eszközöket keres és nem, 15 perc után folytatja a keresést. Mi a helyzet?