Vyzkoušeli jste Simple Scan, výchozí program Ubuntu, ale byli jste zklamaní, že nepodporuje OCR atd.? Je zároveň XSANE příliš komplikovaný pro jednoduchý úkol, který jste si stanovili? Chybí vám, jak snadné bylo skenovat dokumenty pomocí Omnipage?
Není divu ... pojďme se podívat, jak skenovat a provádět OCR v naskenovaných dokumentech velmi, velmi jednoduchým způsobem. Výsledky vás ohromí. |
Jak skenovat ve 2 jednoduchých krocích
1.- Instalovat gscan2pdf & tesseract-ocr (spolu s příslušnou jazykovou sadou). To znamená, že pokud se chystáte skenovat dokumenty v angličtině, nainstalujte si tesseract-ocr-eng; Pokud jsou ve španělštině, nainstalujte si tesseract-ocr-eng a tak.
sudo apt-get install gscan2pdf tesseract-ocr tesseract-ocr-eng
2.- Zbytek je docela přímočarý pro ty z vás, kteří někdy skenovali a OCR dokumentovali ve Windows. otevřel jsem gscan2pdf, naskenujte dokument, přejděte na Možnosti> OCR a vyberte Tesserakt jako OCR engine. Existují i jiné motory, ale Tesseract je zdaleka nejvýkonnějším motorem. Nakonec můžete finální dokument uložit jako PDF, DJVU atd. chystat se Soubor> Uložit.
Následující video je v angličtině, ale stačí ho vidět, abyste pochopili, jak vše funguje.
Alex: Mnoho hráčů má problém dostat «kamarádské pásmo» s dívkami, které mají rádi.
Poté, co zmatené Melisse vysvětlil, že není Waldo,
ale Hon Ludovick Watson, souhlasí, že půjde
Anglie. Vaše otázka také musí být dostatečně JEDNODUCHÁ
aby odpověděla bez hromady myšlenek.
Tady je můj webový blog - Tao of Badass recenze
Všimněte si, že balíčky jsou k dispozici také ve Fedoře. 🙂
Mám dva skenery, jeden je Canon Scan 5000f pro dokumenty A4 a druhý je Braun NovoScan pro skenování negativů a diapozitivů. Po instalaci obslužného programu gscan2 a restartu se nezobrazí žádný ze skenerů. co se stalo? Proč nevidíte skenery?
Žádní přátelé, ale v matematických funkcích OCRing nemá smysl.
V každém případě by měli provést OCR s okolním textem (což vysvětluje tyto funkce nebo cokoli jiného) a že tyto funkce zůstanou jako obrázky.
Na zdraví! Pavel.
Hej, pokud jsi přišel s řešením svého problému, rád bych věděl.
Myslím, že jsem trochu pozdě, ale mám otázku. Jsem student inženýrství a hledám nějaký způsob, jak digitalizovat a vyčistit své poznámky, ale problém je, že většina těchto poznámek je plná matematických symbolů, grafů a funkcí. Existuje v současné době něco, co mi může pomoci?
Skvělý! Dobré rande! V Arch Tesseract je v oficiálních úložištích, ale ne v gscan2pdf. Musíte si jej nainstalovat přes yaourt.
Mockrát vám děkuji, že mi to hodně pomohlo, linux zase dělají přátelštější milost
Nemáš zač! Je mi potěšením pomoci.
Objetí! Pavel.
Velmi dobře, hledal jsem to, zkusím to a řeknu, jak to půjde.
Díky, zkusím to!
Když jdu spustit OCR s motorem Tesseract, dává mi to pouze možnost procesu v angličtině, i když jsem nainstaloval balíček tesseract-ocr-spa. Co mohu udělat?
Stáhnout gnscaner2pdf, ale nekontroluje, pouze vyhledává zařízení a ne, pokračuje v hledání po 15 minutách. Co se děje?