Hur man skannar dokument och använder OCR i Linux

Försökte du Simple Scan, standardprogrammet i Ubuntu, men blev besviken över att se att det inte stöder OCR, etc.? Samtidigt, är XSANE för komplicerat för den enkla uppgift som du tänkte göra? Saknar du hur enkelt det var att skanna dokument med Omnipage?

Inte konstigt ... låt oss se hur man skannar och utför OCR i de skannade dokumenten på ett väldigt, väldigt enkelt sätt. Du kommer att bli förvånad över resultaten.

Hur man skannar i två enkla steg

1.- Installera gscan2pdf & tesseract-ocr (tillsammans med respektive språkpaket). Det vill säga, om du ska skanna dokument på engelska, installera tesseract-ocr-eng; Om de är på spanska, installera tesseract-ocr-eng och så.

sudo apt-get installera gscan2pdf tesseract-ocr tesseract-ocr-spa

2.- Resten är ganska enkel för dem som någonsin har skannat och OCRed ett dokument i Windows. jag öppnade gscan2pdf, skanna dokumentet, gå till Alternativ> OCR och välj tesseract som en OCR-motor. Det finns andra motorer, men Tesseract är den överlägset bäst presterande motorn. Slutligen kan du spara det slutliga dokumentet som PDF, DJVU, etc. ska Arkiv> Spara.

Obs! När du sparar skannade dokument är det bättre att spara dem i DJVU-format (kvaliteten är densamma som en PDF men det är en mycket viktig skillnad i storlek).

Följande video är på engelska men det räcker att se den för att förstå hur allt fungerar.


Innehållet i artikeln följer våra principer om redaktionell etik. Klicka på för att rapportera ett fel här.

13 kommentarer, lämna din

Lämna din kommentar

Din e-postadress kommer inte att publiceras.

*

*

  1. Ansvarig för uppgifterna: Miguel Ángel Gatón
  2. Syftet med uppgifterna: Kontrollera skräppost, kommentarhantering.
  3. Legitimering: Ditt samtycke
  4. Kommunikation av uppgifterna: Uppgifterna kommer inte att kommuniceras till tredje part förutom enligt laglig skyldighet.
  5. Datalagring: databas värd för Occentus Networks (EU)
  6. Rättigheter: När som helst kan du begränsa, återställa och radera din information.

  1.   Anonym sade

    Alex: Många spelare har problem med att få «väninriktad» med tjejer de gillar.
    Efter att ha förklarat för en förvirrad Melissa att han inte är Waldo,
    men Hon Ludovick Watson, hon går med på att gå till
    England. Din fråga måste också vara enkel
    för henne att svara utan massor av tanke.

    Här är min webbblogg - Tao av ​​Badass recension

  2.   bachitux sade

    Observera att paketen också finns i Fedora. 🙂

  3.   kapell sade

    Jag har två skannrar, den ena är Canon Scan 5000f för A4-dokument och den andra är Braun NovoScan, för skanning av negativ och bilder. När du har installerat gscan2-verktyget och startat om ser du ingen av skannrarna. vad hände? Varför ser du inte skannrarna?

  4.   Låt oss använda Linux sade

    Inga kränkande vänner, men det är ingen mening med OCRing-matematiska funktioner.

    I vilket fall som helst är det bekvämt för dem att OCR den omgivande texten (som förklarar dessa funktioner eller vad som helst) och att funktionerna förblir som bilder.
    Skål! Paul.

  5.   Inte från Brooklyn sade

    Hej, om du har kommit fram till en lösning på ditt problem skulle jag vilja veta.

  6.   Juan Vallejo sade

    Jag tror att jag är lite sen men jag har en fråga. Jag är ingenjörsstudent och letar efter något sätt att digitalisera och rengöra mina anteckningar, men problemet är att de flesta av dessa anteckningar är fulla av matematiska symboler, grafer och funktioner. Finns det för närvarande något som kan hjälpa mig?

  7.   Låt oss använda Linux sade

    Bra! Bra datum! I Arch Tesseract finns det i de officiella förvaren, men inte gscan2pdf. Du måste installera den via din yourt.

  8.   elcaliman13142 sade

    Tack så mycket det hjälpte mig mycket, gör Linux mer vänlig nåd igen

  9.   Låt oss använda Linux sade

    Varsågod! Det är ett nöje att ha kunnat hjälpa till.
    En kram! Paul.

  10.   Martin sade

    Mycket bra jag letade efter det, jag ska försöka och jag ska berätta hur det går.

  11.   Mauro Nicolas Ybanez Girard sade

    Tack, jag ska försöka!

  12.   Leonard Hernandez sade

    När jag går för att köra OCR med Tesseract-motorn ger det mig bara möjlighet till processen på engelska trots att jag installerade paketet tesseract-ocr-spa. Vad jag kan göra?

  13.   jaime och isabel sade

    ladda ner gnscaner2pdf men det skannar inte, det söker bara efter enheter och slutar inte söka efter 15 minuter. Vad händer?