Hur man skannar dokument och tillämpa OCR i Linux

Hur man skannar dokument och använder OCR i Linux

Försökte du Simple Scan, standardprogrammet i Ubuntu, men blev besviken över att se att det inte stöder OCR, etc.? Samtidigt, är XSANE för komplicerat för den enkla uppgift som du tänkte göra? Saknar du hur enkelt det var att skanna dokument med Omnipage?

Inte konstigt ... låt oss se hur man skannar och utför OCR i de skannade dokumenten på ett väldigt, väldigt enkelt sätt. Du kommer att bli förvånad över resultaten.

Hur man skannar i två enkla steg

1.- Installera gscan2pdf & tesseract-ocr (tillsammans med respektive språkpaket). Det vill säga, om du ska skanna dokument på engelska, installera tesseract-ocr-eng; Om de är på spanska, installera tesseract-ocr-eng och så.

sudo apt-get installera gscan2pdf tesseract-ocr tesseract-ocr-spa

2.- Resten är ganska enkel för dem som någonsin har skannat och OCRed ett dokument i Windows. jag öppnade gscan2pdf, skanna dokumentet, gå till Alternativ> OCR och välj tesseract som en OCR-motor. Det finns andra motorer, men Tesseract är den överlägset bäst presterande motorn. Slutligen kan du spara det slutliga dokumentet som PDF, DJVU, etc. ska Arkiv> Spara.

Obs! När du sparar skannade dokument är det bättre att spara dem i DJVU-format (kvaliteten är densamma som en PDF men det är en mycket viktig skillnad i storlek).

Följande video är på engelska men det räcker att se den för att förstå hur allt fungerar.

Lämna din kommentar Avbryt svar

Anonym sade
sedan 11 år

Alex: Många spelare har problem med att få «väninriktad» med tjejer de gillar.
Efter att ha förklarat för en förvirrad Melissa att han inte är Waldo,
men Hon Ludovick Watson, hon går med på att gå till
England. Din fråga måste också vara enkel
för henne att svara utan massor av tanke.

Här är min webbblogg - Tao av Badass recension

Svara Anonym
bachitux sade
sedan 11 år

Observera att paketen också finns i Fedora. 🙂

Svara på BachiTux
kapell sade
sedan 11 år

Jag har två skannrar, den ena är Canon Scan 5000f för A4-dokument och den andra är Braun NovoScan, för skanning av negativ och bilder. När du har installerat gscan2-verktyget och startat om ser du ingen av skannrarna. vad hände? Varför ser du inte skannrarna?

Svara på chapela
Låt oss använda Linux sade
sedan 11 år

Inga kränkande vänner, men det är ingen mening med OCRing-matematiska funktioner.

I vilket fall som helst är det bekvämt för dem att OCR den omgivande texten (som förklarar dessa funktioner eller vad som helst) och att funktionerna förblir som bilder.
Skål! Paul.

Svara på Låt oss använda Linux
Inte från Brooklyn sade
sedan 11 år

Hej, om du har kommit fram till en lösning på ditt problem skulle jag vilja veta.

Svara NotFromBrooklyn
Juan Vallejo sade
sedan 11 år

Jag tror att jag är lite sen men jag har en fråga. Jag är ingenjörsstudent och letar efter något sätt att digitalisera och rengöra mina anteckningar, men problemet är att de flesta av dessa anteckningar är fulla av matematiska symboler, grafer och funktioner. Finns det för närvarande något som kan hjälpa mig?

Svara på Juan Vallejo
Låt oss använda Linux sade
sedan 11 år

Bra! Bra datum! I Arch Tesseract finns det i de officiella förvaren, men inte gscan2pdf. Du måste installera den via din yourt.

Svara på Låt oss använda Linux
elcaliman13142 sade
sedan 11 år

Tack så mycket det hjälpte mig mycket, gör Linux mer vänlig nåd igen

Svara på Elcaliman13142
Låt oss använda Linux sade
sedan 11 år

Varsågod! Det är ett nöje att ha kunnat hjälpa till.
En kram! Paul.

Svara på Låt oss använda Linux
Martin sade
sedan 11 år

Mycket bra jag letade efter det, jag ska försöka och jag ska berätta hur det går.

Svara Martin
Mauro Nicolas Ybanez Girard sade
sedan 11 år

Tack, jag ska försöka!

Svar till Mauro Nicolás Ybáñez Girard
Leonard Hernandez sade
sedan 10 år

När jag går för att köra OCR med Tesseract-motorn ger det mig bara möjlighet till processen på engelska trots att jag installerade paketet tesseract-ocr-spa. Vad jag kan göra?

Svar till Leonardo Hernandez
jaime och isabel sade
sedan 5 år

ladda ner gnscaner2pdf men det skannar inte, det söker bara efter enheter och slutar inte söka efter 15 minuter. Vad händer?

Svara på jaime och isabel