Documenten scannen en OCR toepassen in Linux

Heb je Simple Scan geprobeerd, het standaardprogramma in Ubuntu, maar was je teleurgesteld dat het geen OCR ondersteunt, enz.? Is XSANE tegelijkertijd te ingewikkeld voor de eenvoudige taak die u van plan was te doen? Mis je niet hoe gemakkelijk het was om documenten te scannen met Omnipage?

Nou, geen wonder ... laten we eens kijken hoe we OCR kunnen scannen en uitvoeren in de gescande documenten op een heel, heel eenvoudige manier. U zult versteld staan van de resultaten.

Scannen in 2 eenvoudige stappen

1.- installeren gscan2pdf & tesseract-ocr (samen met het bijbehorende taalpakket). Dat wil zeggen, voor het geval u documenten in het Engels gaat scannen, installeert u Hasse-ocr-eng; Als ze in het Spaans zijn, installeer dan tesseract-ocr-eng en dus.

sudo apt-get install gscan2pdf tesseract-ocr tesseract-ocr-eng

2.- De rest is vrij eenvoudig voor degenen die ooit een document in Windows hebben gescand en OCR. Ik opende gscan2pdf, scan het document, ga naar Opties> OCR en selecteer Tesseract als een OCR-engine. Er zijn andere motoren, maar Tesseract is verreweg de best presterende motor. Ten slotte kunt u het definitieve document opslaan als PDF, DJVU, enz. gaan naar Bestand> Opslaan.

Let op: bij het opslaan van gescande documenten is het beter om ze op te slaan in DJVU-formaat (de kwaliteit is hetzelfde als die van een pdf, maar er is een heel belangrijk verschil in grootte).

De volgende video is in het Engels, maar het is voldoende om hem te zien om te begrijpen hoe alles werkt.

Laat je reactie achter Antwoord annuleren

Anoniem zei
geleden Tot 11 jaar

Alex: Veel gamers hebben een probleem met het krijgen van een «vriendengroep» met meisjes die ze leuk vinden.
Na aan een verwarde Melissa te hebben uitgelegd dat hij geen Waldo is,
maar The Hon Ludovick Watson, ze stemt ermee in om naar toe te gaan
Engeland. Uw vraag moet ook EENVOUDIG genoeg zijn
voor haar om zonder een hoop na te denken.

Hier is mijn webblog - Tao of Badass recensie

Reageer op Anoniem
bachitux zei
geleden Tot 11 jaar

Merk op dat de pakketten ook beschikbaar zijn in Fedora. 🙂

Reageer op BachiTux
kapel zei
geleden Tot 11 jaar

Ik heb twee scanners, de ene is de Canon Scan 5000f voor A4-documenten en de andere is Braun NovoScan, voor het scannen van negatieven en dia's. Nadat u het hulpprogramma gscan2 hebt geïnstalleerd en opnieuw hebt opgestart, ziet u geen van de scanners. wat is er gebeurd? Waarom zie je de scanners niet?

Reageer op chapela
Laten we Linux gebruiken zei
geleden Tot 11 jaar

Geen beledigende vrienden, maar het heeft geen zin om wiskundige functies te herkennen.

In elk geval zouden ze OCR moeten doen aan de omringende tekst (die die functies of wat dan ook verklaart) en dat de functies als afbeeldingen blijven.
Proost! Paul.

Reageer op Let's Use Linux
NietVanBrooklyn zei
geleden Tot 11 jaar

Hé, als je een oplossing voor je probleem hebt gevonden, zou ik dat graag willen weten.

Reageer op NotFromBrooklyn
Juan Vallejo zei
geleden Tot 11 jaar

Ik denk dat ik een beetje laat ben, maar ik heb een vraag. Ik ben een technische student en ik ben op zoek naar een manier om mijn aantekeningen te digitaliseren en op te schonen, maar het probleem is dat de meeste van die aantekeningen vol wiskundige symbolen, grafieken en functies staan. Is er momenteel iets dat mij kan helpen?

Reageer op Juan Vallejo
Laten we Linux gebruiken zei
geleden Tot 11 jaar

Super goed! Goede date! In Arch Tesseract staat het in de officiële repositories, maar niet in gscan2pdf. Je moet het via je installeren.

Reageer op Let's Use Linux
elcaliman13142 zei
geleden Tot 11 jaar

Heel erg bedankt, het heeft me veel geholpen, ze maken Linux weer vriendelijker

Reageer op Elcaliman13142
Laten we Linux gebruiken zei
geleden Tot 11 jaar

Graag gedaan! Het is een genoegen om te mogen helpen.
Een knuffel! Paul.

Reageer op Let's Use Linux
Martin zei
geleden Tot 11 jaar

Heel goed, ik was ernaar op zoek, ik zal het proberen en ik zal vertellen hoe dit gaat.

Reageer op Martin
Mauro Nicolas Ybanez Girard zei
geleden Tot 11 jaar

Bedankt, ik zal het proberen!

Reageer op Mauro Nicolás Ybáñez Girard
Leonard Hernandez zei
geleden Tot 10 jaar

Wanneer ik de OCR ga uitvoeren met de Tesseract-engine, geeft het me alleen de optie van het proces in het Engels, ook al heb ik het tesseract-ocr-spa-pakket geïnstalleerd. Wat ik kan doen?

Reageer op Leonardo Hernandez
jaime en isabel zei
geleden Tot 5 jaar

download gnscaner2pdf maar het scant niet, het zoekt alleen naar apparaten en stopt niet met zoeken na 15 minuten. Hoe gaat het?

Reageer op jaime en isabel