Πώς να σαρώσετε έγγραφα και να εφαρμόσετε OCR στο Linux

Έχετε δοκιμάσει το Simple Scan, το προεπιλεγμένο πρόγραμμα Ubuntu, αλλά απογοητευτήκατε επειδή δεν υποστηρίζει OCR κ.λπ.; Ταυτόχρονα, είναι το XSANE πολύ περίπλοκο για την απλή εργασία που σκοπεύετε να κάνετε; Σας λείπει πόσο εύκολο ήταν να σαρώσετε έγγραφα με το Omnipage;

Λοιπόν, δεν είναι περίεργο ... ας δούμε πώς να σαρώσετε και να εκτελέσετε OCR στα σαρωμένα έγγραφα με έναν πολύ, πολύ απλό τρόπο. Θα εκπλαγείτε με τα αποτελέσματα.

Πώς να σαρώσετε σε 2 απλά βήματα

1. - εγκαταστήσετε gscan2pdf & tesseract-ocr (μαζί με το αντίστοιχο πακέτο γλωσσών του). Δηλαδή, σε περίπτωση που πρόκειται να σαρώσετε έγγραφα στα Αγγλικά, εγκαταστήστε το tesseract-ocr-eng; Εάν είναι στα ισπανικά, εγκαταστήστε tesseract-ocr-eng και έτσι.

sudo apt-get εγκατάσταση gscan2pdf tesseract-ocr tesseract-ocr-spa

2. - Τα υπόλοιπα είναι αρκετά απλά για όσους από εσάς έχετε σαρώσει ποτέ και OCR ένα έγγραφο στα Windows. άνοιξα gscan2pdf, σαρώστε το έγγραφο, μεταβείτε στο Επιλογές> OCR και επιλέξτε τεσεράκτ ως κινητήρας OCR. Υπάρχουν και άλλοι κινητήρες, αλλά η Tesseract είναι μακράν η καλύτερη απόδοση. Τέλος, μπορείτε να αποθηκεύσετε το τελικό έγγραφο ως PDF, DJVU κ.λπ. πηγαίνω σε Αρχείο> Αποθήκευση.

Σημείωση: κατά την αποθήκευση σαρωμένων εγγράφων, είναι καλύτερα να τα αποθηκεύσετε σε μορφή DJVU (η ποιότητα είναι ίδια με αυτή ενός PDF, αλλά υπάρχει πολύ σημαντική διαφορά στο μέγεθος).

Το παρακάτω βίντεο είναι στα Αγγλικά, αλλά αρκεί να το δείτε για να καταλάβετε πώς λειτουργούν τα πάντα.


Αφήστε το σχόλιό σας

Η διεύθυνση email σας δεν θα δημοσιευθεί. Τα υποχρεωτικά πεδία σημειώνονται με *

*

*

  1. Υπεύθυνος για τα δεδομένα: Miguel Ángel Gatón
  2. Σκοπός των δεδομένων: Έλεγχος SPAM, διαχείριση σχολίων.
  3. Νομιμοποίηση: Η συγκατάθεσή σας
  4. Κοινοποίηση των δεδομένων: Τα δεδομένα δεν θα κοινοποιούνται σε τρίτους, εκτός από νομική υποχρέωση.
  5. Αποθήκευση δεδομένων: Βάση δεδομένων που φιλοξενείται από τα δίκτυα Occentus (ΕΕ)
  6. Δικαιώματα: Ανά πάσα στιγμή μπορείτε να περιορίσετε, να ανακτήσετε και να διαγράψετε τις πληροφορίες σας.

  1.   ανώνυμος dijo

    Alex: Πολλοί παίκτες έχουν πρόβλημα να «ζουν φίλοι» με κορίτσια που τους αρέσουν.
    Αφού εξήγησε σε μια συγκεχυμένη Melissa ότι δεν είναι Waldo,
    αλλά ο Hon Ludovick Watson, συμφωνεί να πάει
    Αγγλία. Η ερώτησή σας πρέπει επίσης να είναι αρκετά απλή
    για να ανταποκριθεί χωρίς τόνο σκέψης.

    Εδώ είναι το ιστολόγιό μου - Tao of Badass κριτική

  2.   bachitux dijo

    Σημειώστε ότι τα πακέτα είναι επίσης διαθέσιμα στο Fedora. 🙂

  3.   παρεκκλήσι dijo

    Έχω δύο σαρωτές, το ένα είναι το Canon Scan 5000f για έγγραφα A4 και το άλλο είναι το Braun NovoScan, για σάρωση αρνητικών και διαφανειών. Μετά την εγκατάσταση του βοηθητικού προγράμματος gscan2 και την επανεκκίνηση, δεν βλέπετε κανένα από τους σαρωτές. τι συνέβη? Γιατί δεν βλέπετε τους σαρωτές;

  4.   Ας χρησιμοποιήσουμε το Linux dijo

    Χωρίς φίλους επίθεσης, αλλά δεν έχει νόημα οι μαθηματικές συναρτήσεις OCRing.

    Σε κάθε περίπτωση, πρέπει να κάνουν OCR στο περιβάλλον κείμενο (που εξηγεί αυτές τις λειτουργίες ή οτιδήποτε άλλο) και ότι οι συναρτήσεις παραμένουν ως εικόνες
    Στην υγειά σας! Παύλος.

  5.   Όχι από το Μπρούκλιν dijo

    Γεια, αν έχετε βρει μια λύση στο πρόβλημά σας, θα ήθελα να μάθω.

  6.   Juan Vallejo dijo

    Νομίζω ότι είμαι λίγο αργά, αλλά έχω μια ερώτηση. Είμαι φοιτητής μηχανικής και ψάχνω για κάποιο τρόπο να ψηφιοποιήσω και να καθαρίσω τις σημειώσεις μου, αλλά το πρόβλημα είναι ότι οι περισσότερες από αυτές τις σημειώσεις είναι γεμάτες μαθηματικά σύμβολα, γραφήματα και συναρτήσεις. Υπάρχει σήμερα κάτι που μπορεί να με βοηθήσει;

  7.   Ας χρησιμοποιήσουμε το Linux dijo

    Μεγάλος! Καλή ραντεβού! Στο Arch Tesseract βρίσκεται στα επίσημα αποθετήρια, αλλά όχι στο gscan2pdf. Πρέπει να το εγκαταστήσετε μέσω του yaourt.

  8.   elcaliman13142 dijo

    Σας ευχαριστώ πολύ που με βοήθησε πολύ, κάνουν το linux πιο φιλική χάρη και πάλι

  9.   Ας χρησιμοποιήσουμε το Linux dijo

    Παρακαλώ! Είναι χαρά που ήμουν σε θέση να βοηθήσω.
    Μια αγκαλιά! Παύλος.

  10.   Μάρτιν dijo

    Πολύ καλό το έψαχνα, θα προσπαθήσω και θα πω πώς συμβαίνει αυτό.

  11.   Mauro Nicolas Ybanez Girard dijo

    Ευχαριστώ, θα προσπαθήσω!

  12.   Λεονάρντο Χερνάντες dijo

    Όταν πηγαίνω να τρέξω το OCR με τον κινητήρα Tesseract, μου δίνει μόνο την επιλογή της διαδικασίας στα Αγγλικά, παρόλο που εγκατέστησα το πακέτο tesseract-ocr-spa. Τι μπορώ να κάνω?

  13.   jaime και isabel dijo

    κατεβάστε το gnscaner2pdf αλλά δεν κάνει σάρωση, αναζητά μόνο συσκευές και δεν σταματά την αναζήτηση μετά από 15 λεπτά. Ποια είναι τα νέα σου?