Czy wypróbowałeś Simple Scan, domyślny program Ubuntu, ale rozczarowałeś się, że nie obsługuje on OCR itp.? Jednocześnie, czy XSANE jest zbyt skomplikowane dla prostego zadania, które zamierzałeś wykonać? Czy tęsknisz za tym, jak łatwo było skanować dokumenty za pomocą Omnipage?
Cóż, nic dziwnego ... zobaczmy, jak skanować i wykonywać OCR w zeskanowanych dokumentach w bardzo, bardzo prosty sposób. Będziesz zaskoczony wynikami. |
Jak skanować w 2 prostych krokach
1.- zainstalować gscan2pdf & tesserakt-ocr (wraz z odpowiednim pakietem językowym). Oznacza to, że jeśli zamierzasz skanować dokumenty w języku angielskim, zainstaluj tesserakt-ocr-eng; Jeśli są w języku hiszpańskim, zainstaluj tesseract-ocr-eng a więc.
sudo apt-get zainstaluj gscan2pdf tesseract-ocr tesseract-ocr-spa
2.- Reszta jest całkiem prosta dla tych z Was, którzy kiedykolwiek skanowali i OCR dokument w systemie Windows. otworzyłem gscan2pdf, zeskanuj dokument, przejdź do Opcje> OCR i wybierz Tesseract jako silnik OCR. Istnieją inne silniki, ale Tesseract jest zdecydowanie najlepszym silnikiem. Na koniec możesz zapisać ostateczny dokument jako PDF, DJVU itp. zamierzam Plik> Zapisz.
Poniższy film jest w języku angielskim, ale wystarczy go zobaczyć, aby zrozumieć, jak wszystko działa.
Alex: Wielu graczy ma problem z „strefą znajomych” z dziewczynami, które lubią.
Po wyjaśnieniu zdezorientowanej Melissie, że nie jest Waldo,
ale Hon Ludovick Watson, ona zgadza się iść
Anglia. Twoje pytanie również musi być wystarczająco PROSTE
żeby odpowiedziała bez zastanowienia.
Oto mój blog internetowy - Tao Badass Review
Zauważ, że pakiety są również dostępne w Fedorze. 🙂
Mam dwa skanery, jeden to Canon Scan 5000f do dokumentów A4, a drugi to Braun NovoScan, do skanowania negatywów i slajdów. Po zainstalowaniu narzędzia gscan2 i ponownym uruchomieniu nie widać żadnego skanera. co się stało? Dlaczego nie widzisz skanerów?
Bez urazy, przyjaciele, ale nie ma sensu rozpoznawanie funkcji matematycznych.
W każdym razie powinni wykonać OCR do otaczającego tekstu (który wyjaśnia te funkcje lub cokolwiek) i zachować funkcje jako obrazy.
Twoje zdrowie! Paweł.
Hej, jeśli znalazłeś rozwiązanie swojego problemu, chciałbym wiedzieć.
Myślę, że trochę się spóźniłem, ale mam pytanie. Jestem studentem inżynierii i szukam sposobu na zdigitalizowanie i wyczyszczenie moich notatek, ale problem polega na tym, że większość tych notatek jest pełna symboli matematycznych, wykresów i funkcji. Czy jest obecnie coś, co może mi pomóc?
Świetny! Dobra randka! W Arch Tesseract znajduje się w oficjalnych repozytoriach, ale nie w gscan2pdf. Musisz go zainstalować przez yaourt.
Dziękuję bardzo, bardzo mi pomogło, sprawiają, że linux znów jest bardziej przyjazny
Nie ma za co! To przyjemność móc pomóc.
Uścisk! Paweł.
Bardzo dobrze szukałem, spróbuję i powiem jak to idzie.
Dzięki, spróbuję!
Kiedy idę uruchomić OCR z silnikiem Tesseract, daje mi to tylko opcję procesu w języku angielskim, mimo że zainstalowałem pakiet tesseract-ocr-spa. Co mogę zrobić?
Pobierz gnscaner2pdf, ale nie skanuje, tylko wyszukuje urządzenia, a nie je, kontynuuje wyszukiwanie po 15 min. Co tam?