Как да сканирате документи и да прилагате OCR в Linux

Как да сканирам документи и да приложа OCR в Linux

Пробвали ли сте Simple Scan, програмата по подразбиране в Ubuntu, но сте разочаровани да видите, че тя не поддържа OCR и т.н.? В същото време XSANE твърде сложен ли е за простата задача, която сте си поставили за задача? Липсва ли ви колко лесно беше да сканирате документи с Omnipage?

Е, нищо чудно ... нека да видим как да сканираме и да извършим OCR в сканираните документи по много, много прост начин. Ще бъдете изумени от резултатите.

Как да сканирам в 2 прости стъпки

1.- инсталирам gscan2pdf & тесеракт-окр (заедно със съответния езиков пакет). Тоест, в случай че ще сканирате документи на английски, инсталирайте teseract-ocr-eng; Ако са на испански, инсталирайте тесеракт-ocr-spa и така.

sudo apt-get инсталиране gscan2pdf tesseract-ocr tesseract-ocr-spa

2.- Останалото е доста лесно за тези, които някога са сканирали и OCR документ в Windows. аз отворих gscan2pdf, сканирайте документа, отидете на Опции> OCR и изберете тесеракт като OCR двигател. Има и други двигатели, но Tesseract е най-добре представящият се двигател. И накрая, можете да запазите окончателния документ като PDF, DJVU и т.н. отивам до Файл> Запазване.

Забележка: при запазване на сканирани документи е най-добре да ги запазите във формат DJVU (качеството е същото като PDF, но има много важна разлика в размера).

Следващото видео е на английски, но е достатъчно да го видите, за да разберете как работи всичко.

Оставете вашия коментар Отказ на отговора

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *

коментар *

име*

Електронната поща*

Приемам условия за поверителност*

Отговорен за данните: Мигел Анхел Гатон
Предназначение на данните: Контрол на СПАМ, управление на коментари.
Легитимация: Вашето съгласие
Съобщаване на данните: Данните няма да бъдат съобщени на трети страни, освен по законово задължение.
Съхранение на данни: База данни, хоствана от Occentus Networks (ЕС)
Права: По всяко време можете да ограничите, възстановите и изтриете информацията си.

Искам да получа бюлетина

анонимен каза той
hace 11 година

Алекс: Много геймъри имат проблем да получат «приятел на зони» с момичета, които харесват.
След като обясни на объркана Мелиса, че не е Уолдо,
но Hon Ludovick Watson, тя се съгласява да отиде при
Англия. Въпросът ви също трябва да е достатъчно ПРОСТО
за да отговори без много мисъл.

Ето моят уеб блог - Преглед на Tao of Badass

Отговорете на Anonymous
бахитукс каза той
hace 11 година

Забележете, че пакетите са налични и във Fedora. 🙂

Отговорете на BachiTux
параклис каза той
hace 11 година

Имам два скенера, единият е Canon Scan 5000f за документи A4, а другият е Braun NovoScan, за сканиране на негативи и слайдове. След като инсталирате помощната програма gscan2 и рестартирате, не виждате нито един от скенерите. какво стана? Защо не виждате скенерите?

Отговорете на chapela
Нека използваме Linux каза той
hace 11 година

Не обиждайте приятели, но няма смисъл да OCRing математически функции.

Във всеки случай те трябва да направят OCR на околния текст (който обяснява тези функции или каквото и да е друго) и че функциите остават като изображения.
Наздраве! Павел.

Отговорете на Нека използваме Linux
Не от Бруклин каза той
hace 11 година

Хей, ако сте намерили решение на проблема си, бих искал да знам.

Отговорете на NotFromBrooklyn
Хуан Валехо каза той
hace 11 година

Мисля, че закъснях малко, но имам въпрос. Аз съм студент по инженерство и търся някакъв начин да дигитализирам и почистя бележките си, но проблемът е, че повечето от тези бележки са пълни с математически символи, графики и функции. В момента има ли нещо, което може да ми помогне?

Отговорете на Хуан Валехо
Нека използваме Linux каза той
hace 11 година

Страхотен! Хубава среща! В Arch Tesseract той е в официалните хранилища, но не и gscan2pdf. Трябва да го инсталирате чрез yaourt.

Отговорете на Нека използваме Linux
Елкалиман13142 каза той
hace 11 година

Благодаря ви много, много ми помогна, те отново правят linux по-приятелска грация

Отговор на Elcaliman13142
Нека използваме Linux каза той
hace 11 година

Моля! За мен е удоволствие да мога да помогна.
Прегръдка! Павел.

Отговорете на Нека използваме Linux
лястовица каза той
hace 11 година

Много добре го търсих, ще опитам и ще кажа как става това.

Отговорете на Мартин
Мауро Николас Ибаниес Жирар каза той
hace 11 година

Благодаря, ще опитам!

Отговор на Mauro Nicolás Ybáñez Girard
Леонардо Ернандес каза той
hace 10 година

Когато отида да стартирам OCR с двигателя Tesseract, той ми дава само опцията за процеса на английски, въпреки че инсталирах пакета tesseract-ocr-spa. Какво мога да направя?

Отговор на Леонардо Ернандес
jaime и isabel каза той
hace 5 година

изтеглете gnscaner2pdf, но той не сканира, той само търси устройства и не спира да търси след 15 минути. Какво става?

Отговорете на jaime и isabel