Kuidas skannida dokumente ja rakendada OCR-i Linuxis

Kas olete proovinud Ubuntu vaikeprogrammi Simple Scan, kuid pidite pettuma, kui nägite, et see ei toeta OCR-i jne? Kas XSANE on samal ajal liiga keeruline teie seatud lihtsa ülesande jaoks? Kas tunnete puudust, kui lihtne oli dokumente Omnipage'iga skannida?

Noh, pole ime ... Vaatame, kuidas skannida ja OCR-i teha skannitud dokumentides väga-väga lihtsal viisil. Tulemustega olete üllatunud.

Kuidas skannida 2 lihtsa sammuga

1.- paigaldama gscan2pdf & tesserakt-ocr (koos vastava keelepaketiga). See tähendab, et kui kavatsete dokumente skannida inglise keeles, installige see tesserakt-ocr-eng; Kui need on hispaania keeles, installige need tesserakt-ocr-eng ja nii.

sudo apt-get install gscan2pdf tesseract-ocr tesseract-ocr-eng

2.- Ülejäänud on nende jaoks üsna lihtne, kes on kunagi Windowsi dokumenti skanninud ja OCR-i skanninud. ma avasin gscan2pdf, skannige dokument, minge aadressile Valikud> OCR ja valige Tesseract OCR-mootorina. On ka teisi mootoreid, kuid Tesseract on ülekaalukalt kõige paremini toimiv mootor. Lõpuks saate lõpliku dokumendi salvestada PDF-failina, DJVU-na jne. minek Fail> Salvesta.

Märkus: skannitud dokumentide salvestamisel on parem salvestada need DJVU-vormingus (kvaliteet on sama, mis PDF-il, kuid suuruse erinevus on väga oluline).

Järgmine video on ingliskeelne, kuid selle nägemiseks piisab, et mõista, kuidas kõik töötab.


Jäta oma kommentaar

Sinu e-postiaadressi ei avaldata. Kohustuslikud väljad on tähistatud *

*

*

  1. Andmete eest vastutab: Miguel Ángel Gatón
  2. Andmete eesmärk: Rämpsposti kontrollimine, kommentaaride haldamine.
  3. Seadustamine: teie nõusolek
  4. Andmete edastamine: andmeid ei edastata kolmandatele isikutele, välja arvatud juriidilise kohustuse alusel.
  5. Andmete salvestamine: andmebaas, mida haldab Occentus Networks (EL)
  6. Õigused: igal ajal saate oma teavet piirata, taastada ja kustutada.

  1.   anonüümne DIJO

    Alex: Paljudel mängijatel on probleem saada neile meeldivatele tüdrukutele sõber.
    Pärast segaduses olevale Melissale selgitamist, et ta pole Waldo,
    kuid The Hon Ludovick Watson on ta nõus minema
    Inglismaa. Ka teie küsimus peab olema piisavalt lihtne
    et ta vastaks ilma mõtlemata.

    Siin on minu veebiblogi - Tao of Badass Review

  2.   bachitux DIJO

    Pange tähele, et paketid on saadaval ka Fedoras. 🙂

  3.   kabel DIJO

    Mul on kaks skannerit, üks on A5000-formaadis dokumentide jaoks mõeldud Canon Scan 4f ja teine ​​on negatiivide ja slaidide skannimiseks mõeldud Braun NovoScan. Pärast utiliidi gscan2 installimist ja taaskäivitamist ei näe te ühtegi skannerit. mis juhtus? Miks te skannereid ei näe?

  4.   Kasutame Linuxi DIJO

    Pole ühtegi solvavat sõpra, kuid matemaatikafunktsioonide OCR-i kirjutamiseks pole mõtet.

    Igal juhul peaksid nad tegema ümbritseva teksti jaoks OCR-i (mis selgitab neid funktsioone või mida iganes) ja et funktsioonid jääksid piltidena.
    Terviseks! Paul.

  5.   MitteBrooklynist DIJO

    Kuule, kui olete oma probleemile lahenduse pakkunud, tahaksin teada.

  6.   Juan Vallejo DIJO

    Ma arvan, et olen natuke hiljaks jäänud, kuid mul on küsimus. Olen inseneriõpilane ja otsin mingit viisi oma märkmete digiteerimiseks ja puhastamiseks, kuid probleem on selles, et enamik neist märkmetest on täis matemaatilisi sümboleid, graafikuid ja funktsioone. Kas praegu on midagi, mis mind saaks aidata?

  7.   Kasutame Linuxi DIJO

    Suurepärane! Hea kuupäev! Arch Tesseractis on see ametlikes hoidlates, kuid mitte gscan2pdf. Peate selle installima yaourti kaudu.

  8.   elcaliman13142 DIJO

    Suur aitäh, see aitas mind palju, muutke linux jälle sõbralikumaks armu

  9.   Kasutame Linuxi DIJO

    Tere tulemast! On hea meel, et sain aidata.
    Kallistus! Paul.

  10.   Martin DIJO

    Väga hea, ma otsisin seda, proovin ja räägin, kuidas see läheb.

  11.   Mauro Nicolas Ybanez Girard DIJO

    Aitäh, proovin!

  12.   Leonard Hernandez DIJO

    Tesseract mootoriga OCR-i juhtima minnes annab see protsessile võimaluse vaid inglise keeles, kuigi installisin paketi tesseract-ocr-spa. Mida ma teha saan?

  13.   jaime ja isabel DIJO

    Laadige alla gnscaner2pdf, kuid see ei skaneeri, vaid otsib ainult seadmeid, mitte seda, see jätkab otsimist 15 minuti pärast. Mis toimub?