Пробвали ли сте Simple Scan, програмата по подразбиране в Ubuntu, но сте разочаровани да видите, че тя не поддържа OCR и т.н.? В същото време XSANE твърде сложен ли е за простата задача, която сте си поставили за задача? Липсва ли ви колко лесно беше да сканирате документи с Omnipage?
Е, нищо чудно ... нека да видим как да сканираме и да извършим OCR в сканираните документи по много, много прост начин. Ще бъдете изумени от резултатите. |
Как да сканирам в 2 прости стъпки
1.- инсталирам gscan2pdf & тесеракт-окр (заедно със съответния езиков пакет). Тоест, в случай че ще сканирате документи на английски, инсталирайте teseract-ocr-eng; Ако са на испански, инсталирайте тесеракт-ocr-spa и така.
sudo apt-get инсталиране gscan2pdf tesseract-ocr tesseract-ocr-spa
2.- Останалото е доста лесно за тези, които някога са сканирали и OCR документ в Windows. аз отворих gscan2pdf, сканирайте документа, отидете на Опции> OCR и изберете тесеракт като OCR двигател. Има и други двигатели, но Tesseract е най-добре представящият се двигател. И накрая, можете да запазите окончателния документ като PDF, DJVU и т.н. отивам до Файл> Запазване.
Следващото видео е на английски, но е достатъчно да го видите, за да разберете как работи всичко.
Алекс: Много геймъри имат проблем да получат «приятел на зони» с момичета, които харесват.
След като обясни на объркана Мелиса, че не е Уолдо,
но Hon Ludovick Watson, тя се съгласява да отиде при
Англия. Въпросът ви също трябва да е достатъчно ПРОСТО
за да отговори без много мисъл.
Ето моят уеб блог - Преглед на Tao of Badass
Забележете, че пакетите са налични и във Fedora. 🙂
Имам два скенера, единият е Canon Scan 5000f за документи A4, а другият е Braun NovoScan, за сканиране на негативи и слайдове. След като инсталирате помощната програма gscan2 и рестартирате, не виждате нито един от скенерите. какво стана? Защо не виждате скенерите?
Не обиждайте приятели, но няма смисъл да OCRing математически функции.
Във всеки случай те трябва да направят OCR на околния текст (който обяснява тези функции или каквото и да е друго) и че функциите остават като изображения.
Наздраве! Павел.
Хей, ако сте намерили решение на проблема си, бих искал да знам.
Мисля, че закъснях малко, но имам въпрос. Аз съм студент по инженерство и търся някакъв начин да дигитализирам и почистя бележките си, но проблемът е, че повечето от тези бележки са пълни с математически символи, графики и функции. В момента има ли нещо, което може да ми помогне?
Страхотен! Хубава среща! В Arch Tesseract той е в официалните хранилища, но не и gscan2pdf. Трябва да го инсталирате чрез yaourt.
Благодаря ви много, много ми помогна, те отново правят linux по-приятелска грация
Моля! За мен е удоволствие да мога да помогна.
Прегръдка! Павел.
Много добре го търсих, ще опитам и ще кажа как става това.
Благодаря, ще опитам!
Когато отида да стартирам OCR с двигателя Tesseract, той ми дава само опцията за процеса на английски, въпреки че инсталирах пакета tesseract-ocr-spa. Какво мога да направя?
изтеглете gnscaner2pdf, но той не сканира, той само търси устройства и не спира да търси след 15 минути. Какво става?