Kā skenēt dokumentus un lietot OCR operētājsistēmā Linux

Vai esat izmēģinājis vienkāršo skenēšanu, noklusējuma Ubuntu programmu, bet esat vīlušies, redzot, ka tas neatbalsta OCR utt.? Vai tajā pašā laikā XSANE ir pārāk sarežģīts vienkāršajam uzdevumam, kuru esat iecerējis veikt? Vai jums pietrūkst, cik viegli bija skenēt dokumentus, izmantojot Omnipage?

Nu, nav brīnums ... redzēsim, kā skenēt un veikt OCR skenētajos dokumentos ļoti, ļoti vienkāršā veidā. Jūs būsiet pārsteigti ar rezultātiem.

Kā skenēt 2 vienkāršās darbībās

1. - instalēt gscan2pdf & tesserakts-okr (kopā ar attiecīgās valodas pakotni). Tas ir, ja jūs gatavojaties skenēt dokumentus angļu valodā, instalējiet tesseract-ocr-eng; Ja tie ir spāņu valodā, instalējiet tesseract-ocr-eng un tā tālāk

sudo apt-get install gscan2pdf tesseract-ocr tesseract-ocr-eng

2. - Pārējais ir diezgan vienkāršs tiem, kas jebkad ir skenējuši un OCR dokumentu sistēmā Windows. ES atvēru gscan2pdf, skenējiet dokumentu, dodieties uz Opcijas> OCR un atlasiet Tesseact kā OCR dzinējs. Ir arī citi dzinēji, taču Tesseract ir neapšaubāmi labākais dzinējs. Visbeidzot, jūs varat saglabāt galīgo dokumentu kā PDF, DJVU utt. ejot uz Fails> Saglabāt.

Piezīme: saglabājot skenētus dokumentus, labāk tos saglabāt DJVU formātā (kvalitāte ir tāda pati kā PDF, taču ir ļoti būtiska izmēra atšķirība).

Šis video ir angļu valodā, taču pietiek ar to redzēt, lai saprastu, kā viss darbojas.


Atstājiet savu komentāru

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti ar *

*

*

  1. Atbildīgais par datiem: Migels Ángels Gatóns
  2. Datu mērķis: SPAM kontrole, komentāru pārvaldība.
  3. Legitimācija: jūsu piekrišana
  4. Datu paziņošana: Dati netiks paziņoti trešām personām, izņemot juridiskus pienākumus.
  5. Datu glabāšana: datu bāze, ko mitina Occentus Networks (ES)
  6. Tiesības: jebkurā laikā varat ierobežot, atjaunot un dzēst savu informāciju.

  1.   Anonīmi teica

    Alekss: Daudziem spēlētājiem ir problēmas nokļūt «draugu zonā» ar meitenēm, kuras viņiem patīk.
    Apjukušajai Melisai paskaidrojis, ka viņš nav Valdo,
    bet The Hon Ludovick Watson, viņa piekrīt doties uz
    Anglija. Arī jūsu jautājumam jābūt pietiekami vienkāršam
    lai viņa atbildētu bez pārdomām.

    Šeit ir mans tīmekļa emuārs - Tao of Badass apskats

  2.   bachitux teica

    Ievērojiet, ka paketes ir pieejamas arī Fedora. 🙂

  3.   kapela teica

    Man ir divi skeneri, viens ir Canon Scan 5000f A4 formāta dokumentiem, bet otrs ir Braun NovoScan, lai skenētu negatīvus un slaidus. Pēc utilītas gscan2 instalēšanas un pārstartēšanas jūs neredzat nevienu no skeneriem. kas notika? Kāpēc jūs neredzat skenerus?

  4.   Izmantosim Linux teica

    Cilvēki nav aizvainojuši, taču nav jēgas OCR rakstīt matemātikas funkcijas.

    Jebkurā gadījumā viņiem ir jādara OCR apkārtējam tekstam (kas izskaidro šīs vai citas funkcijas) un ka funkcijas paliek kā attēli.
    Priekā! Pāvils.

  5.   NoBrooklyn teica

    Hei, ja jūs esat izdomājis savas problēmas risinājumu, es gribētu zināt.

  6.   Juan Vallejo teica

    Es domāju, ka es esmu nedaudz nokavējis, bet man ir jautājums. Es esmu inženierzinātņu students un meklēju veidu, kā digitalizēt un iztīrīt piezīmes, taču problēma ir tā, ka lielākā daļa šo piezīmju ir pilnas ar matemātiskiem simboliem, grafikiem un funkcijām. Vai šobrīd kaut kas var man palīdzēt?

  7.   Izmantosim Linux teica

    Lieliski! Labs randiņš! Arch Tesseract tas atrodas oficiālajos krātuvēs, bet ne gscan2pdf. Jums tas ir jāinstalē caur jurtu.

  8.   Elkalimans13142 teica

    Liels paldies, tas man ļoti palīdzēja, viņi atkal padara linux draudzīgāku žēlastību

  9.   Izmantosim Linux teica

    Nav par ko! Prieks, ka varēju palīdzēt.
    Apskāviens! Pāvils.

  10.   čurkste teica

    Ļoti labi, ka es to meklēju, mēģināšu un pastāstīšu, kā tas notiek.

  11.   Mauro Nikols Ybáñez Girard teica

    Paldies, es mēģināšu!

  12.   Leonardo Ernandess teica

    Kad es eju palaist OCR ar Tesseract dzinēju, tas man dod iespēju tikai izvēlēties procesu angļu valodā, kaut arī es instalēju tesseract-ocr-spa pakotni. Ko es varu darīt?

  13.   jaime un isabel teica

    lejupielādējiet gnscaner2pdf, bet tas neskenē, tas meklē tikai ierīces un nepārtrauc meklēšanu pēc 15 minūtēm. Kas notiek?