Miyaad isku dayday Sawir Fudud, barnaamijka asalka ah ee Ubuntu, laakiin waad ka niyad jabtay inaad aragto inaysan taageerin OCR, iwm. Isla markaa, XSANE ma ku adag yahay hawsha fudud ee aad u jeedday inaad qabato? Miyaad seegtay sida ay u fududahay in dukumiintiyada lagu sawiro Omnipage?
Hagaag, layaab maleh ... aan aragno sida loo baaro loona sameeyo OCR ee dukumiintiyada la marsiiyey qaab aad iyo aad u fudud. Waxaad la yaabi doontaa natiijooyinka. |
Sida loo iskaan 2 talaabo oo fudud
1.- Rakib gscan2pdf & tesseract-ocr (oo ay weheliso xirmooyinkeeda luqadeed). Si kale haddii loo dhigo, haddii ay dhacdo inaad dukumiintiyada ku baarto Ingiriis, rakib isku-darka-ocr-eng; Haddii ay ku jiraan Isbaanish, rakib Tesseract-ocr- Eng iyo sidaas.
sudo apt-hel rakib gscan2pdf tesseract-ocr tesseract-ocr-spa
2.- Inta soo hartay waa wax toos ah oo loogu talagalay kuwa waligood iskaan iyo OCRed dukumiinti ku jira Windows. Waan furay gscan2pdf, iskaan dukumiintiga, tag Fursadaha> OCR oo xulo Tesserakt sida mishiinka OCR. Waxaa jira matooro kale, laakiin Tesseract waa mashiinka ugu waxqabadka fiican. Ugu dambeyntii, waad keydin kartaa dukumintiga ugu dambeeya sida PDF, DJVU, iwm. u socdaa Fayl> Keydso.
Fiidiyowga soo socda waa Ingiriisi laakiin waa ku filan tahay in la arko si loo fahmo sida wax walba u shaqeeyaan.
Alex: Ciyaartoy badan ayaa dhibaato ka haysata helitaanka «saaxiibtinimada aagagga» gabdhaha ay jecel yihiin.
Ka dib markii uu u sharaxay Melissa wareersan inuusan aheyn Waldo,
laakiin The Hon Ludovick Watson, waxay ogolaatay inay aado
England. Su'aashaadu sidoo kale waxay u baahan tahay inay noqoto FUDUD ku filan
iyada inay ka jawaabto iyada oo aan tan oo fikir ah.
Waa tan mareegteyda internetka - Tao ee Dib u eegista Badass
Ogsoonow in baakadaha sidoo kale laga heli karo Fedora. 🙂
Waxaan hayaa laba iskaanro, mid waa Canon Scan 5000f oo loogu talagalay dukumiintiyada A4, kan kalena waa Braun NovoScan, oo loogu talagalay iskaanka waxyaabaha diidmada ah iyo isjiidadka. Ka dib markaad rakibto qalabka 'gscan2', iyo dib-u-kicinta, ma arkaysid mid ka mid ah iskaanka. maxaa dhacay? Maxaad u arki weyday qalabka wax lagu sawiro?
Ma jiro dad dembi leh, laakiin dhib malahan howlaha xisaabta OCRing.
Sikastaba xaalku ha ahaadee, waa ku haboon tahay iyaga OCR qoraalka ku hareeraysan (kaas oo sharaxaya shaqooyinkaas ama wax kasta) iyo in shaqooyinku ay ahaadaan sida sawirro.
Farxad! Bawlos.
Haye, hadaad xal uhesho dhibaatadaada, waxaan jeclaan lahaa inaan ogaado.
Waxaan u maleynayaa inaan yara soo daahay laakiin waxaan qabaa su'aal. Anigu waxaan ahay arday injineernimada waxaanan raadinayaa hab aan ku qoro oo aan ku nadiifiyo qoraalladayda laakiin dhibaatadu waxay tahay in qoraalladaas badankood ay ka buuxaan astaamo xisaabeed, garaafyo iyo shaqooyin. Ma jiraan wax haatan I caawin kara?
Wanaagsan! Taariikh wanaagsan! 'Arch Tesseract' waxay ku taal bakhaarada rasmiga ah, laakiin maaha gscan2pdf. Waa inaad ku rakibtaa iyada oo loo marayo yaourt.
Aad baad u mahadsan tihiin wax badan ayey i caawisay, waxay Linux ka dhigaan nimco saaxiibtinimo markale
Adaa mudan! Waa wax lagu farxo inaan awooday inaan ku caawiyo.
Habsiin! Bawlos.
Si aad ah ayaan u raadinayay, waan isku dayi doonaa waana sheegi doonaa sida ay wax u socdaan.
Mahadsanid, waan isku dayi doonaa!
Markii aan u socdo in aan OCR ku ordo mashiinka 'Tesseract' kaliya waxay i siineysaa ikhtiyaarka howsha oo ah Ingiriis in kasta oo aan rakibey xirmada tesseract-ocr-spa. Maxaan sameyn karaa?
soo dejiso gnscaner2pdf laakiin ma baarto, kaliya waxay raadisaa aaladaha mana joojiso raadinta ka dib 15 daqiiqo. Maxaa jira