Cómo escanear documentos y aplicar OCR en Linux

Kā skenēt dokumentus un lietot OCR operētājsistēmā Linux

Vai esat izmēģinājis vienkāršo skenēšanu, noklusējuma Ubuntu programmu, bet esat vīlušies, redzot, ka tas neatbalsta OCR utt.? Vai tajā pašā laikā XSANE ir pārāk sarežģīts vienkāršajam uzdevumam, kuru esat iecerējis veikt? Vai jums pietrūkst, cik viegli bija skenēt dokumentus, izmantojot Omnipage?

Nu, nav brīnums ... redzēsim, kā skenēt un veikt OCR skenētajos dokumentos ļoti, ļoti vienkāršā veidā. Jūs būsiet pārsteigti ar rezultātiem.

Kā skenēt 2 vienkāršās darbībās

1. - instalēt gscan2pdf & tesserakts-okr (kopā ar attiecīgās valodas pakotni). Tas ir, ja jūs gatavojaties skenēt dokumentus angļu valodā, instalējiet tesseract-ocr-eng; Ja tie ir spāņu valodā, instalējiet tesseract-ocr-eng un tā tālāk

sudo apt-get install gscan2pdf tesseract-ocr tesseract-ocr-eng

2. - Pārējais ir diezgan vienkāršs tiem, kas jebkad ir skenējuši un OCR dokumentu sistēmā Windows. ES atvēru gscan2pdf, skenējiet dokumentu, dodieties uz Opcijas> OCR un atlasiet Tesseact kā OCR dzinējs. Ir arī citi dzinēji, taču Tesseract ir neapšaubāmi labākais dzinējs. Visbeidzot, jūs varat saglabāt galīgo dokumentu kā PDF, DJVU utt. ejot uz Fails> Saglabāt.

Piezīme: saglabājot skenētus dokumentus, labāk tos saglabāt DJVU formātā (kvalitāte ir tāda pati kā PDF, taču ir ļoti būtiska izmēra atšķirība).

Šis video ir angļu valodā, taču pietiek ar to redzēt, lai saprastu, kā viss darbojas.

Atstājiet savu komentāru Atcelt atbildi

Anonīmi teica
dara 11 gadi

Alekss: Daudziem spēlētājiem ir problēmas nokļūt «draugu zonā» ar meitenēm, kuras viņiem patīk.
Apjukušajai Melisai paskaidrojis, ka viņš nav Valdo,
bet The Hon Ludovick Watson, viņa piekrīt doties uz
Anglija. Arī jūsu jautājumam jābūt pietiekami vienkāršam
lai viņa atbildētu bez pārdomām.

Šeit ir mans tīmekļa emuārs - Tao of Badass apskats

Atbildēt anonīmi
bachitux teica
dara 11 gadi

Ievērojiet, ka paketes ir pieejamas arī Fedora. 🙂

Atbildēt BachiTux
kapela teica
dara 11 gadi

Man ir divi skeneri, viens ir Canon Scan 5000f A4 formāta dokumentiem, bet otrs ir Braun NovoScan, lai skenētu negatīvus un slaidus. Pēc utilītas gscan2 instalēšanas un pārstartēšanas jūs neredzat nevienu no skeneriem. kas notika? Kāpēc jūs neredzat skenerus?

Atbildēt kapelai
Izmantosim Linux teica
dara 11 gadi

Cilvēki nav aizvainojuši, taču nav jēgas OCR rakstīt matemātikas funkcijas.

Jebkurā gadījumā viņiem ir jādara OCR apkārtējam tekstam (kas izskaidro šīs vai citas funkcijas) un ka funkcijas paliek kā attēli.
Priekā! Pāvils.

Atbildiet uz Izmantosim Linux
NoBrooklyn teica
dara 11 gadi

Hei, ja jūs esat izdomājis savas problēmas risinājumu, es gribētu zināt.

Atbildēt NotFromBrooklyn
Juan Vallejo teica
dara 11 gadi

Es domāju, ka es esmu nedaudz nokavējis, bet man ir jautājums. Es esmu inženierzinātņu students un meklēju veidu, kā digitalizēt un iztīrīt piezīmes, taču problēma ir tā, ka lielākā daļa šo piezīmju ir pilnas ar matemātiskiem simboliem, grafikiem un funkcijām. Vai šobrīd kaut kas var man palīdzēt?

Atbildiet Huanam Vallejo
Izmantosim Linux teica
dara 11 gadi

Lieliski! Labs randiņš! Arch Tesseract tas atrodas oficiālajos krātuvēs, bet ne gscan2pdf. Jums tas ir jāinstalē caur jurtu.

Atbildiet uz Izmantosim Linux
Elkalimans13142 teica
dara 11 gadi

Liels paldies, tas man ļoti palīdzēja, viņi atkal padara linux draudzīgāku žēlastību

Atbildēt Elcaliman13142
Izmantosim Linux teica
dara 11 gadi

Nav par ko! Prieks, ka varēju palīdzēt.
Apskāviens! Pāvils.

Atbildiet uz Izmantosim Linux
čurkste teica
dara 11 gadi

Ļoti labi, ka es to meklēju, mēģināšu un pastāstīšu, kā tas notiek.

Atbildi Mārtiņam
Mauro Nikols Ybáñez Girard teica
dara 11 gadi

Paldies, es mēģināšu!

Atbildēt Mauro Nicolás Ybáñez Girard
Leonardo Ernandess teica
dara 10 gadi

Kad es eju palaist OCR ar Tesseract dzinēju, tas man dod iespēju tikai izvēlēties procesu angļu valodā, kaut arī es instalēju tesseract-ocr-spa pakotni. Ko es varu darīt?

Atbilde Leonardo Ernandezam
jaime un isabel teica
dara 5 gadi

lejupielādējiet gnscaner2pdf, bet tas neskenē, tas meklē tikai ierīces un nepārtrauc meklēšanu pēc 15 minūtēm. Kas notiek?

Atbildēt jaime un isabel