Jak skenovat dokumenty a používat OCR v Linuxu

Jak skenovat dokumenty a používat OCR v systému Linux

Vyzkoušeli jste Simple Scan, výchozí program Ubuntu, ale byli jste zklamaní, že nepodporuje OCR atd.? Je zároveň XSANE příliš komplikovaný pro jednoduchý úkol, který jste si stanovili? Chybí vám, jak snadné bylo skenovat dokumenty pomocí Omnipage?

Není divu ... pojďme se podívat, jak skenovat a provádět OCR v naskenovaných dokumentech velmi, velmi jednoduchým způsobem. Výsledky vás ohromí.

Jak skenovat ve 2 jednoduchých krocích

1.- Instalovat gscan2pdf & tesseract-ocr (spolu s příslušnou jazykovou sadou). To znamená, že pokud se chystáte skenovat dokumenty v angličtině, nainstalujte si tesseract-ocr-eng; Pokud jsou ve španělštině, nainstalujte si tesseract-ocr-eng a tak.

sudo apt-get install gscan2pdf tesseract-ocr tesseract-ocr-eng

2.- Zbytek je docela přímočarý pro ty z vás, kteří někdy skenovali a OCR dokumentovali ve Windows. otevřel jsem gscan2pdf, naskenujte dokument, přejděte na Možnosti> OCR a vyberte Tesserakt jako OCR engine. Existují i jiné motory, ale Tesseract je zdaleka nejvýkonnějším motorem. Nakonec můžete finální dokument uložit jako PDF, DJVU atd. chystat se Soubor> Uložit.

Poznámka: Při ukládání naskenovaných dokumentů je nejlepší je ukládat ve formátu DJVU (kvalita je stejná jako ve formátu PDF, ale existuje velmi důležitý rozdíl ve velikosti).

Následující video je v angličtině, ale stačí ho vidět, abyste pochopili, jak vše funguje.

Zanechte svůj komentář Zrušit odpověď

Anonymní řekl
před 11 let

Alex: Mnoho hráčů má problém dostat «kamarádské pásmo» s dívkami, které mají rádi.
Poté, co zmatené Melisse vysvětlil, že není Waldo,
ale Hon Ludovick Watson, souhlasí, že půjde
Anglie. Vaše otázka také musí být dostatečně JEDNODUCHÁ
aby odpověděla bez hromady myšlenek.

Tady je můj webový blog - Tao of Badass recenze

Odpovědět Anonymous
bachitux řekl
před 11 let

Všimněte si, že balíčky jsou k dispozici také ve Fedoře. 🙂

Odpovědět BachiTux
kaple řekl
před 11 let

Mám dva skenery, jeden je Canon Scan 5000f pro dokumenty A4 a druhý je Braun NovoScan pro skenování negativů a diapozitivů. Po instalaci obslužného programu gscan2 a restartu se nezobrazí žádný ze skenerů. co se stalo? Proč nevidíte skenery?

Odpověď chapele
Pojďme použít Linux řekl
před 11 let

Žádní přátelé, ale v matematických funkcích OCRing nemá smysl.

V každém případě by měli provést OCR s okolním textem (což vysvětluje tyto funkce nebo cokoli jiného) a že tyto funkce zůstanou jako obrázky.
Na zdraví! Pavel.

Odpovězte na Pojďme používat Linux
Ne z Brooklynu řekl
před 11 let

Hej, pokud jsi přišel s řešením svého problému, rád bych věděl.

Odpověď NotFromBrooklyn
Juan Vallejo řekl
před 11 let

Myslím, že jsem trochu pozdě, ale mám otázku. Jsem student inženýrství a hledám nějaký způsob, jak digitalizovat a vyčistit své poznámky, ale problém je, že většina těchto poznámek je plná matematických symbolů, grafů a funkcí. Existuje v současné době něco, co mi může pomoci?

Odpověď Juan Vallejo
Pojďme použít Linux řekl
před 11 let

Skvělý! Dobré rande! V Arch Tesseract je v oficiálních úložištích, ale ne v gscan2pdf. Musíte si jej nainstalovat přes yaourt.

Odpovězte na Pojďme používat Linux
elcaliman13142 řekl
před 11 let

Mockrát vám děkuji, že mi to hodně pomohlo, linux zase dělají přátelštější milost

Odpověď uživateli Elcaliman13142
Pojďme použít Linux řekl
před 11 let

Nemáš zač! Je mi potěšením pomoci.
Objetí! Pavel.

Odpovězte na Pojďme používat Linux
Martin řekl
před 11 let

Velmi dobře, hledal jsem to, zkusím to a řeknu, jak to půjde.

Odpověď Martinovi
Mauro Nicolas Ybanez Girard řekl
před 11 let

Díky, zkusím to!

Odpověď Mauro Nicolás Ybáñez Girard
Leonardo Hernandez řekl
před 10 let

Když jdu spustit OCR s motorem Tesseract, dává mi to pouze možnost procesu v angličtině, i když jsem nainstaloval balíček tesseract-ocr-spa. Co mohu udělat?

Odpověď Leonardovi Hernandezovi
jaime a isabel řekl
před 5 let

Stáhnout gnscaner2pdf, ale nekontroluje, pouze vyhledává zařízení a ne, pokračuje v hledání po 15 minutách. Co se děje?

Odpovězte Jaime a Isabel