כיצד לסרוק מסמכים ולהחיל OCR בלינוקס

האם ניסית את Simple Scan, תוכנית ברירת המחדל באובונטו, אבל התאכזבת לראות שהיא לא תומכת ב- OCR וכו '? יחד עם זאת, האם XSANE מסובך מדי למשימה הפשוטה שאותה התכוונת לבצע? האם אתה מתגעגע כמה קל היה לסרוק מסמכים באמצעות Omnipage?

ובכן, לא פלא ... בואו נראה איך לסרוק ולבצע OCR במסמכים הסרוקים בצורה מאוד מאוד פשוטה. תתפלאו מהתוצאות.

כיצד לסרוק בשני שלבים פשוטים

1.- להתקין gscan2pdf & tesseract-ocr (יחד עם חבילת השפה בהתאמה). כלומר, במקרה שאתה הולך לסרוק מסמכים באנגלית, התקן tesseract-ocr-eng; אם הם בספרדית, התקן tesseract-ocr-eng וכך.

sudo apt-get להתקין gscan2pdf tesseract-ocr tesseract-ocr-spa

2.- השאר די פשוט עבור אלה שסרקו אי פעם OCRed מסמך ב- Windows. אני פתחתי gscan2pdf, סרוק את המסמך, עבור אל אפשרויות> OCR ובחר טסרקט כמנוע OCR. ישנם מנועים אחרים, אך טסראקט הוא ללא ספק המנוע בעל הביצועים הטובים ביותר. לבסוף, תוכלו לשמור את המסמך הסופי כקובץ PDF, DJVU וכו '. הולך ל קובץ> שמור.

הערה: בעת שמירת מסמכים סרוקים עדיף לשמור אותם בפורמט DJVU (האיכות זהה לזו של מסמך PDF אך יש הבדל חשוב מאוד בגודל).

הסרטון הבא באנגלית אבל מספיק לראות אותו כדי להבין איך הכל עובד.


השאירו את התגובה שלכם

כתובת הדוא"ל שלך לא תפורסם. שדות חובה מסומנים *

*

*

  1. אחראי לנתונים: מיגל אנחל גטון
  2. מטרת הנתונים: בקרת ספאם, ניהול תגובות.
  3. לגיטימציה: הסכמתך
  4. מסירת הנתונים: הנתונים לא יועברו לצדדים שלישיים אלא בהתחייבות חוקית.
  5. אחסון נתונים: מסד נתונים המתארח על ידי Occentus Networks (EU)
  6. זכויות: בכל עת תוכל להגביל, לשחזר ולמחוק את המידע שלך.

  1.   אנונימי דיג'ו

    אלכס: לגיימרים רבים יש בעיה להשיג את "חבר המיועד" לבנות שהן אוהבות.
    אחרי שהסברתי למליסה המבולבלת שהוא לא וואלדו,
    אבל כבוד לודוביק ווטסון, היא מסכימה ללכת
    אַנְגלִיָה. גם השאלה שלך צריכה להיות די פשוטה
    שהיא תגיב בלי המון מחשבה.

    הנה בלוג האינטרנט שלי - טאו מבדיקת בדאס

  2.   בכיטוקס דיג'ו

    שימו לב שהחבילות זמינות גם בפדורה. 🙂

  3.   קפלה דיג'ו

    יש לי שני סורקים, האחד הוא Canon Scan 5000f למסמכי A4 והשני הוא Braun NovoScan, לסריקת תשלילים ושקופיות. לאחר התקנת כלי השירות gscan2 והפעלה מחדש, אינך רואה אף אחד מהסורקים. מה קרה? למה אתה לא רואה את הסורקים?

  4.   בואו נשתמש בלינוקס דיג'ו

    אין חברים עבירים, אך אין טעם בפונקציות מתמטיקה של OCRing.

    בכל מקרה, עליהם לעשות OCR לטקסט שמסביב (שמסביר את הפונקציות האלה או כל דבר אחר) ושהפונקציות יישארו כתמונות.
    לחיים! פול.

  5.   לא מברוקלין דיג'ו

    היי, אם הגעת לפיתרון לבעיה שלך, הייתי רוצה לדעת.

  6.   חואן ואלג'ו דיג'ו

    אני חושב שאני מאחר קצת אבל יש לי שאלה. אני סטודנט להנדסה ואני מחפש דרך לספר את השטרות ולנקות אותם, אבל הבעיה היא שרוב ההערות האלה מלאות בסמלים, גרפים ופונקציות מתמטיות. האם כרגע יש משהו שיכול לעזור לי?

  7.   בואו נשתמש בלינוקס דיג'ו

    גדול! תאריך טוב! ב- Arch Tesseract זה נמצא במאגרים הרשמיים, אך לא ב- gscan2pdf. אתה צריך להתקין אותו דרך yourt.

  8.   אלקלימאן 13142 דיג'ו

    תודה רבה זה עזר לי מאוד, הם הופכים את הלינוקס לחסד יותר ידידותי

  9.   בואו נשתמש בלינוקס דיג'ו

    בבקשה! זה תענוג שהצלחנו לעזור.
    חיבוק! פול.

  10.   סנונית דיג'ו

    טוב מאוד שחיפשתי את זה, אנסה ואגיד איך זה הולך.

  11.   מאורו ניקולאס יבנז ג'ירארד דיג'ו

    תודה, אנסה!

  12.   לאונרדו הרננדז דיג'ו

    כשאני הולך להפעיל את ה- OCR עם מנוע Tesseract זה נותן לי רק אפשרות לתהליך באנגלית למרות שהתקנתי את חבילת tesseract-ocr-spa. מה אני יכול לעשות?

  13.   חיימה ואיזבל דיג'ו

    הורד את gnscaner2pdf אבל הוא לא סורק, הוא מחפש רק מכשירים ולא מפסיק לחפש אחרי 15 דקות. מה קורה?