Documenten scannen en OCR toepassen in Linux

Heb je Simple Scan geprobeerd, het standaardprogramma in Ubuntu, maar was je teleurgesteld dat het geen OCR ondersteunt, enz.? Is XSANE tegelijkertijd te ingewikkeld voor de eenvoudige taak die u van plan was te doen? Mis je niet hoe gemakkelijk het was om documenten te scannen met Omnipage?

Nou, geen wonder ... laten we eens kijken hoe we OCR kunnen scannen en uitvoeren in de gescande documenten op een heel, heel eenvoudige manier. U zult versteld staan ​​van de resultaten.

Scannen in 2 eenvoudige stappen

1.- installeren gscan2pdf & tesseract-ocr (samen met het bijbehorende taalpakket). Dat wil zeggen, voor het geval u documenten in het Engels gaat scannen, installeert u Hasse-ocr-eng; Als ze in het Spaans zijn, installeer dan tesseract-ocr-eng en dus.

sudo apt-get install gscan2pdf tesseract-ocr tesseract-ocr-eng

2.- De rest is vrij eenvoudig voor degenen die ooit een document in Windows hebben gescand en OCR. Ik opende gscan2pdf, scan het document, ga naar Opties> OCR en selecteer Tesseract als een OCR-engine. Er zijn andere motoren, maar Tesseract is verreweg de best presterende motor. Ten slotte kunt u het definitieve document opslaan als PDF, DJVU, enz. gaan naar Bestand> Opslaan.

Let op: bij het opslaan van gescande documenten is het beter om ze op te slaan in DJVU-formaat (de kwaliteit is hetzelfde als die van een pdf, maar er is een heel belangrijk verschil in grootte).

De volgende video is in het Engels, maar het is voldoende om hem te zien om te begrijpen hoe alles werkt.


Laat je reactie achter

Uw e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *

*

*

  1. Verantwoordelijk voor de gegevens: Miguel Ángel Gatón
  2. Doel van de gegevens: Controle SPAM, commentaarbeheer.
  3. Legitimatie: uw toestemming
  4. Mededeling van de gegevens: De gegevens worden niet aan derden meegedeeld, behalve op grond van wettelijke verplichting.
  5. Gegevensopslag: database gehost door Occentus Networks (EU)
  6. Rechten: u kunt uw gegevens op elk moment beperken, herstellen en verwijderen.

  1.   Anoniem zei

    Alex: Veel gamers hebben een probleem met het krijgen van een «vriendengroep» met meisjes die ze leuk vinden.
    Na aan een verwarde Melissa te hebben uitgelegd dat hij geen Waldo is,
    maar The Hon Ludovick Watson, ze stemt ermee in om naar toe te gaan
    Engeland. Uw vraag moet ook EENVOUDIG genoeg zijn
    voor haar om zonder een hoop na te denken.

    Hier is mijn webblog - Tao of Badass recensie

  2.   bachitux zei

    Merk op dat de pakketten ook beschikbaar zijn in Fedora. 🙂

  3.   kapel zei

    Ik heb twee scanners, de ene is de Canon Scan 5000f voor A4-documenten en de andere is Braun NovoScan, voor het scannen van negatieven en dia's. Nadat u het hulpprogramma gscan2 hebt geïnstalleerd en opnieuw hebt opgestart, ziet u geen van de scanners. wat is er gebeurd? Waarom zie je de scanners niet?

  4.   Laten we Linux gebruiken zei

    Geen beledigende vrienden, maar het heeft geen zin om wiskundige functies te herkennen.

    In elk geval zouden ze OCR moeten doen aan de omringende tekst (die die functies of wat dan ook verklaart) en dat de functies als afbeeldingen blijven.
    Proost! Paul.

  5.   NietVanBrooklyn zei

    Hé, als je een oplossing voor je probleem hebt gevonden, zou ik dat graag willen weten.

  6.   Juan Vallejo zei

    Ik denk dat ik een beetje laat ben, maar ik heb een vraag. Ik ben een technische student en ik ben op zoek naar een manier om mijn aantekeningen te digitaliseren en op te schonen, maar het probleem is dat de meeste van die aantekeningen vol wiskundige symbolen, grafieken en functies staan. Is er momenteel iets dat mij kan helpen?

  7.   Laten we Linux gebruiken zei

    Super goed! Goede date! In Arch Tesseract staat het in de officiële repositories, maar niet in gscan2pdf. Je moet het via je installeren.

  8.   elcaliman13142 zei

    Heel erg bedankt, het heeft me veel geholpen, ze maken Linux weer vriendelijker

  9.   Laten we Linux gebruiken zei

    Graag gedaan! Het is een genoegen om te mogen helpen.
    Een knuffel! Paul.

  10.   Martin zei

    Heel goed, ik was ernaar op zoek, ik zal het proberen en ik zal vertellen hoe dit gaat.

  11.   Mauro Nicolas Ybanez Girard zei

    Bedankt, ik zal het proberen!

  12.   Leonard Hernandez zei

    Wanneer ik de OCR ga uitvoeren met de Tesseract-engine, geeft het me alleen de optie van het proces in het Engels, ook al heb ik het tesseract-ocr-spa-pakket geïnstalleerd. Wat ik kan doen?

  13.   jaime en isabel zei

    download gnscaner2pdf maar het scant niet, het zoekt alleen naar apparaten en stopt niet met zoeken na 15 minuten. Hoe gaat het?