Belgeler nasıl taranır ve Linux'ta OCR nasıl uygulanır

Varsayılan Ubuntu programı olan Simple Scan'i denediniz ancak OCR'yi vb. Desteklemediğini görünce hayal kırıklığına uğradınız mı? Aynı zamanda, XSANE yapmak için belirlediğiniz basit görev için fazla karmaşık mı? Omnipage ile belgeleri taramanın ne kadar kolay olduğunu özlüyor musunuz?

Hiç şüphe yok ... OCR'yi nasıl tarayacağımızı ve gerçekleştireceğimizi görelim taranan belgelerde çok çok basit bir şekilde. Sonuçlara hayran kalacaksınız.

2 basit adımda nasıl tarama yapılır

1. - kurmak gscan2pdf & tesseract-ocr (ilgili dil paketiyle birlikte). Başka bir deyişle, belgeleri İngilizce olarak tarayacaksanız, tesseract-ocr-eng; İspanyolca iseler, yükleyin tesseract-ocr-eng ve bu yüzden.

sudo apt-get kurulum gscan2pdf tesseract-ocr tesseract-ocr-spa

2. - Geri kalanı, Windows'ta bir belge tarayan ve OCR işlemi yapanlar için oldukça basit. ben açtım gscan2pdf, belgeyi tara, git Seçenekler> OCR ve seçin teserakt OCR motoru olarak. Başka motorlar da var, ancak Tesseract açık ara en iyi performans gösteren motor. Son olarak, son belgeyi PDF, DJVU vb. Olarak kaydedebilirsiniz. gidiyor Dosya> Kaydet.

Not: Taranan belgeleri kaydederken, bunları DJVU formatında kaydetmek daha iyidir (kalite PDF ile aynıdır ancak boyutta çok önemli bir fark vardır).

Aşağıdaki video İngilizcedir ancak her şeyin nasıl çalıştığını anlamak için onu görmek yeterlidir.


13 yorum, sizinkini bırakın

Yorumunuzu bırakın

E-posta hesabınız yayınlanmayacak. Gerekli alanlar ile işaretlenmiştir *

*

*

  1. Verilerden sorumlu: Miguel Ángel Gatón
  2. Verilerin amacı: Kontrol SPAM, yorum yönetimi.
  3. Meşruiyet: Onayınız
  4. Verilerin iletilmesi: Veriler, yasal zorunluluk dışında üçüncü kişilere iletilmeyecektir.
  5. Veri depolama: Occentus Networks (AB) tarafından barındırılan veritabanı
  6. Haklar: Bilgilerinizi istediğiniz zaman sınırlayabilir, kurtarabilir ve silebilirsiniz.

  1.   Anonim dijo

    Alex: Pek çok oyuncu sevdikleri kızlarla "arkadaş bölgelerine" girme konusunda sorun yaşıyor.
    Kafası karışmış Melisa'ya Ali olmadığını açıkladıktan sonra,
    ama Hon Ludovick Watson, o gitmeyi kabul eder
    İngiltere. Sorunuzun da yeterince basit olması gerekiyor
    bir ton düşünmeden cevap vermesi için.

    İşte benim web blogum - Tao of Badass İnceleme

  2.   bachitux dijo

    Paketlerin Fedora'da da mevcut olduğuna dikkat edin. 🙂

  3.   şapel dijo

    İki tarayıcım var, biri A5000 belgeler için Canon Scan 4f, diğeri ise negatifleri ve slaytları taramak için Braun NovoScan. Gscan2 yardımcı programını yükledikten ve yeniden başlattıktan sonra tarayıcıların hiçbirini görmüyorsunuz. ne oldu? Tarayıcıları neden görmüyorsunuz?

  4.   Hadi Linux kullanalım dijo

    Arkadaşlara saldırmayın, ancak OCRing matematik işlevlerinin bir anlamı yok.

    Her durumda, çevreleyen metni (bu işlevleri ya da her neyse açıklayan) OCR yapmaları ve işlevlerin görüntü olarak kalması uygundur.
    Şerefe! Paul.

  5.   Brooklyn'den değil dijo

    Hey, sorununa bir çözüm bulursan, bilmek isterim.

  6.   Juan Vallejo dijo

    Sanırım biraz geciktim ama bir sorum var. Ben bir mühendislik öğrencisiyim ve notlarımı sayısallaştırmanın ve temizlemenin bir yolunu arıyorum ama sorun şu ki bu notların çoğu matematiksel semboller, grafikler ve fonksiyonlarla dolu. Şu anda bana yardımcı olabilecek bir şey var mı?

  7.   Hadi Linux kullanalım dijo

    Harika! İyi randevu! Arch Tesseract'ta resmi depolardadır, ancak gscan2pdf değildir. Yaourt üzerinden yüklemelisiniz.

  8.   Elcaliman 13142 dijo

    Çok teşekkür ederim, bana çok yardımcı oldu, linux'u yeniden dostça zarafet haline getirdiler

  9.   Hadi Linux kullanalım dijo

    Rica ederim! Yardım edebilmek benim için bir zevk.
    Sarılmak! Paul.

  10.   kırlangıç dijo

    Çok iyi arıyordum, deneyeceğim ve bunun nasıl gittiğini anlatacağım.

  11.   Mauro Nicolas Ybanez Girard dijo

    Teşekkürler, deneyeceğim!

  12.   Leonard Hernandez dijo

    OCR'yi Tesseract motoruyla çalıştırmaya gittiğimde, tesseract-ocr-spa paketini kurmuş olmama rağmen bana yalnızca İngilizce işlem seçeneği sunuyor. Ne yapabilirim?

  13.   jaime ve isabel dijo

    Gnscaner2pdf dosyasını indirin ancak tarama yapmaz, sadece cihazları arar, onu değil, 15 dakika sonra aramaya devam eder. Naber?