Linux에서 문서를 스캔하고 OCR을 적용하는 방법

Ubuntu의 기본 프로그램인 Simple Scan을 사용해 보았지만 OCR 등을 지원하지 않아 실망하셨습니까? 동시에 XSANE이 수행하려는 간단한 작업에 비해 너무 복잡합니까? Omnipage로 문서를 스캔하는 것이 얼마나 쉬웠는지 그립습니까?

글쎄, 당연히 ... OCR을 스캔하고 수행하는 방법을 살펴 보겠습니다. 아주 아주 간단한 방법으로 스캔 된 문서에서. 결과에 놀랄 것입니다..

간단한 2 단계로 스캔하는 방법

1.- 설치 gscan2pdf & tesseract-ocr (해당 언어 팩과 함께). 즉, 영어로 된 문서를 스캔하려면 다음을 설치하십시오. tesseract-ocr-eng; 스페인어 인 경우 설치 tesseract-ocr-스파 그리고.

sudo apt-get 설치 gscan2pdf tesseract-ocr tesseract-ocr-spa

2.- 나머지는 Windows에서 문서를 스캔하고 OCR한 적이 있는 사용자에게는 매우 간단합니다. 내가 열었다 gscan2pdf, 문서 스캔, 이동 옵션> OCR 그리고 선택 정팔 포체 OCR 엔진으로. 다른 엔진이 있지만 Tesseract가 단연 최고의 성능을 발휘합니다. 마지막으로 최종 문서를 PDF, DJVU 등으로 저장할 수 있습니다. ~에 가다 파일> 저장.

참고 : 스캔 한 문서를 저장할 때 DJVU 형식으로 저장하는 것이 좋습니다 (품질은 PDF와 동일하지만 크기에는 매우 중요한 차이가 있음).

다음 비디오는 영어로 되어 있지만 모든 것이 어떻게 작동하는지 이해하려면 시청하는 것으로 충분합니다.

코멘트를 남겨주세요 답장 취소

익명 말
전 11 년

Alex : 많은 게이머가 좋아하는 소녀와«친구 존»을 얻는 데 문제가 있습니다.
혼란스러운 멜리사에게 그가 월리가 아니라고 설명한 후
하지만 Hon Ludovick Watson, 그녀는
영국. 질문도 충분히 간단해야합니다.
그녀가 생각없이 반응 할 수 있도록

내 웹 블로그는 다음과 같습니다. Badass 검토의 타오

익명으로 답장
바치턱스 말
전 11 년

패키지는 Fedora에서도 사용할 수 있습니다. 🙂

BachiTux에 답장
예배당 말
전 11 년

두 대의 스캐너가 있는데 하나는 A5000 문서 용 Canon Scan 4f이고 다른 하나는 네거티브 및 슬라이드 스캔 용 Braun NovoScan입니다. gscan2 유틸리티를 설치하고 재부팅 한 후 스캐너가 표시되지 않습니다. 어떻게 된 거예요? 스캐너가 보이지 않는 이유는 무엇입니까?

채 플라에 답장
Linux를 사용합시다 말
전 11 년

불쾌한 사람은 없지만 OCRing 수학 함수에는 의미가 없습니다.

어쨌든 그들은 주변 텍스트 (해당 기능 등을 설명하는)에 대해 OCR을 수행해야하며 기능은 이미지로 남아 있어야합니다.
건배! 폴.

Let 's Use Linux에 응답
브루클린에서 아님 말
전 11 년

이봐, 당신이 당신의 문제에 대한 해결책을 찾았다면, 알고 싶습니다.

NotFromBrooklyn에 답장
후안 발레 호 말
전 11 년

조금 늦었다 고 생각하는데 질문이 있습니다. 저는 공대생이고 노트를 디지털화하고 정리하는 방법을 찾고 있지만 문제는 대부분의 노트가 수학 기호, 그래프 및 함수로 가득 차 있다는 것입니다. 현재 나를 도울 수있는 것이 있습니까?

Juan Vallejo에게 답장
Linux를 사용합시다 말
전 11 년

큰! 좋은 데이트! Arch Tesseract에서는 공식 저장소에 있지만 gscan2pdf는 아닙니다. yaourt를 통해 설치해야합니다.

Let 's Use Linux에 응답
엘 칼리 만 13142 말
전 11 년

제게 많은 도움을 주어서 감사합니다. 그들은 다시 리눅스를 더 친근한 은혜로 만듭니다.

트윗 담아 가기
Linux를 사용합시다 말
전 11 년

천만에요! 도움을 줄 수있어서 기쁩니다.
포옹! 폴.

Let 's Use Linux에 응답
마틴 말
전 11 년

나는 그것을 찾고 있었다 아주 좋았습니다, 나는 시도하고 이것이 어떻게 진행되는지 말할 것입니다.

마틴에게 답장
마우로 니콜라스 이바네즈 지라르 말
전 11 년

고마워요!

Mauro Nicolás Ybáñez Girard 님에게 답장
레오나르도 에르난데스 말
전 10 년

Tesseract 엔진으로 OCR을 실행하면 tesseract-ocr-spa 패키지를 설치 했음에도 불구하고 영어로 된 프로세스 옵션 만 제공됩니다. 내가 할 수있는 것?

Leonardo Hernandez에게 답장
하이메와 이사벨 말
전 5 년

gnscaner2pdf를 다운로드하지만 스캔하지 않고 장치 만 검색하고 검색하지 않고 15 분 후에 계속 검색합니다. 뭐야?

Jaime 및 Isabel에게 답장