Linux에서 문서를 스캔하고 OCR을 적용하는 방법

Ubuntu의 기본 프로그램인 Simple Scan을 사용해 보았지만 OCR 등을 지원하지 않아 실망하셨습니까? 동시에 XSANE이 수행하려는 간단한 작업에 비해 너무 복잡합니까? Omnipage로 문서를 스캔하는 것이 얼마나 쉬웠는지 그립습니까?

글쎄, 당연히 ... OCR을 스캔하고 수행하는 방법을 살펴 보겠습니다. 아주 아주 간단한 방법으로 스캔 된 문서에서. 결과에 놀랄 것입니다..

간단한 2 단계로 스캔하는 방법

1.- 설치 gscan2pdf & tesseract-ocr (해당 언어 팩과 함께). 즉, 영어로 된 문서를 스캔하려면 다음을 설치하십시오. tesseract-ocr-eng; 스페인어 인 경우 설치 tesseract-ocr-스파 그리고.

sudo apt-get 설치 gscan2pdf tesseract-ocr tesseract-ocr-spa

2.- 나머지는 Windows에서 문서를 스캔하고 OCR한 적이 있는 사용자에게는 매우 간단합니다. 내가 열었다 gscan2pdf, 문서 스캔, 이동 옵션> OCR 그리고 선택 정팔 포체 OCR 엔진으로. 다른 엔진이 있지만 Tesseract가 단연 최고의 성능을 발휘합니다. 마지막으로 최종 문서를 PDF, DJVU 등으로 저장할 수 있습니다. ~에 가다 파일> 저장.

참고 : 스캔 한 문서를 저장할 때 DJVU 형식으로 저장하는 것이 좋습니다 (품질은 PDF와 동일하지만 크기에는 매우 중요한 차이가 있음).

다음 비디오는 영어로 되어 있지만 모든 것이 어떻게 작동하는지 이해하려면 시청하는 것으로 충분합니다.


코멘트를 남겨주세요

귀하의 이메일 주소는 공개되지 않습니다. 필수 필드가 표시되어 있습니다 *

*

*

  1. 데이터 책임자 : Miguel Ángel Gatón
  2. 데이터의 목적 : 스팸 제어, 댓글 관리.
  3. 합법성 : 귀하의 동의
  4. 데이터 전달 : 법적 의무에 의한 경우를 제외하고 데이터는 제 XNUMX 자에게 전달되지 않습니다.
  5. 데이터 저장소 : Occentus Networks (EU)에서 호스팅하는 데이터베이스
  6. 권리 : 귀하는 언제든지 귀하의 정보를 제한, 복구 및 삭제할 수 있습니다.

  1.   익명

    Alex : 많은 게이머가 좋아하는 소녀와«친구 존»을 얻는 데 문제가 있습니다.
    혼란스러운 멜리사에게 그가 월리가 아니라고 설명한 후
    하지만 Hon Ludovick Watson, 그녀는
    영국. 질문도 충분히 간단해야합니다.
    그녀가 생각없이 반응 할 수 있도록

    내 웹 블로그는 다음과 같습니다. Badass 검토의 타오

  2.   바치턱스

    패키지는 Fedora에서도 사용할 수 있습니다. 🙂

  3.   예배당

    두 대의 스캐너가 있는데 하나는 A5000 문서 용 Canon Scan 4f이고 다른 하나는 네거티브 및 슬라이드 스캔 용 Braun NovoScan입니다. gscan2 유틸리티를 설치하고 재부팅 한 후 스캐너가 표시되지 않습니다. 어떻게 된 거예요? 스캐너가 보이지 않는 이유는 무엇입니까?

  4.   Linux를 사용합시다

    불쾌한 사람은 없지만 OCRing 수학 함수에는 의미가 없습니다.

    어쨌든 그들은 주변 텍스트 (해당 기능 등을 설명하는)에 대해 OCR을 수행해야하며 기능은 이미지로 남아 있어야합니다.
    건배! 폴.

  5.   브루클린에서 아님

    이봐, 당신이 당신의 문제에 대한 해결책을 찾았다면, 알고 싶습니다.

  6.   후안 발레 호

    조금 늦었다 고 생각하는데 질문이 있습니다. 저는 공대생이고 노트를 디지털화하고 정리하는 방법을 찾고 있지만 문제는 대부분의 노트가 수학 기호, 그래프 및 함수로 가득 차 있다는 것입니다. 현재 나를 도울 수있는 것이 있습니까?

  7.   Linux를 사용합시다

    큰! 좋은 데이트! Arch Tesseract에서는 공식 저장소에 있지만 gscan2pdf는 아닙니다. yaourt를 통해 설치해야합니다.

  8.   엘 칼리 만 13142

    제게 많은 도움을 주어서 감사합니다. 그들은 다시 리눅스를 더 친근한 은혜로 만듭니다.

  9.   Linux를 사용합시다

    천만에요! 도움을 줄 수있어서 기쁩니다.
    포옹! 폴.

  10.   마틴

    나는 그것을 찾고 있었다 아주 좋았습니다, 나는 시도하고 이것이 어떻게 진행되는지 말할 것입니다.

  11.   마우로 니콜라스 이바네즈 지라르

    고마워요!

  12.   레오나르도 에르난데스

    Tesseract 엔진으로 OCR을 실행하면 tesseract-ocr-spa 패키지를 설치 했음에도 불구하고 영어로 된 프로세스 옵션 만 제공됩니다. 내가 할 수있는 것?

  13.   하이메와 이사벨

    gnscaner2pdf를 다운로드하지만 스캔하지 않고 장치 만 검색하고 검색하지 않고 15 분 후에 계속 검색합니다. 뭐야?