ಪಿಡಿಎಫ್ ಅನ್ನು ಒಸಿಆರ್ ಮಾಡುವುದು ಹೇಗೆ ಮತ್ತು ಪಠ್ಯ ಆಯ್ಕೆ ಮತ್ತು ಹುಡುಕಾಟವನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುವುದು

1 ನಿಮಿಷ

ನಿಮ್ಮಲ್ಲಿ ಸ್ಕ್ಯಾನರ್ ಬಳಸಿ ರಚಿಸಲಾದ ಪಿಡಿಎಫ್ ಇದೆ ಎಂದು ಭಾವಿಸೋಣ ಅಥವಾ ಅವರು ಅದನ್ನು ನಿಮಗೆ ರವಾನಿಸಿದ್ದಾರೆ ಆದರೆ ಅದು ಚಿತ್ರದ ರೂಪದಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಹೊಂದಿರುತ್ತದೆ. ನಮ್ಮ ಪ್ರೀತಿಯ ಪಿಡಿಎಫ್ ಅನ್ನು ನಾವು ಸಲ್ಲಿಸಬೇಕಾದ ವಿಧಾನವನ್ನು ಕರೆಯಲಾಗುತ್ತದೆ ಒಸಿಆರ್: ಒಂದು ಪಠ್ಯ ವರ್ಣಮಾಲೆಗೆ ಸೇರಿದ ಚಿಹ್ನೆಗಳು ಅಥವಾ ಅಕ್ಷರಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಗುರುತಿಸುವ ಪ್ರಕ್ರಿಯೆ, ಚಿತ್ರದಿಂದ ಅದನ್ನು ಡೇಟಾ ರೂಪದಲ್ಲಿ ಸಂಗ್ರಹಿಸಲು ನಾವು ಪಠ್ಯ ಸಂಪಾದನೆ ಕಾರ್ಯಕ್ರಮದ ಮೂಲಕ ಅಥವಾ ಅಂತಹುದೇ ಸಂವಹನ ನಡೆಸಬಹುದು.

pdfocr ಎನ್ನುವುದು ಸರಳವಾದ ಸಾಧನವಾಗಿದ್ದು ಅದು ಹೊಸ ಪಿಡಿಎಫ್ ಅನ್ನು ಎಂಬೆಡೆಡ್ ಟೆಕ್ಸ್ಟ್ ಲೇಯರ್ನೊಂದಿಗೆ ರಚಿಸುತ್ತದೆ, ಇದು ಪಿಡಿಎಫ್ನ ಅಂತಿಮ ನೋಟವನ್ನು ಬದಲಾಯಿಸದೆ ಪಠ್ಯವನ್ನು ಆಯ್ಕೆ ಮಾಡಲು ಮತ್ತು ಅದರಲ್ಲಿ ಪದಗಳನ್ನು ಹುಡುಕಲು ಬಳಕೆದಾರರಿಗೆ ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ.

ಯಾವ ಪಿಡಿಫೋಕರ್ ಇದಕ್ಕಾಗಿ ಅಲ್ಲ:

ಪಿಡಿಎಫ್ ಚಿತ್ರ ರೂಪದಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಹೊಂದಿದ್ದರೆ ಮಾತ್ರ ಇದು ಉಪಯುಕ್ತವಾಗಿರುತ್ತದೆ; ನೀವು ಓಪನ್ ಆಫೀಸ್‌ನಿಂದ ಪಿಡಿಎಫ್ ಅನ್ನು ರಫ್ತು ಮಾಡಿದರೆ, ಅದು ಈಗಾಗಲೇ ಎಂಬೆಡೆಡ್ ಪಠ್ಯ ಪದರವನ್ನು ಹೊಂದಿದೆ, ಆದ್ದರಿಂದ ಈ ವಿಧಾನವು ಅನಗತ್ಯವಾಗಿದೆ.

Pdfocr ಅನ್ನು ಹೇಗೆ ಸ್ಥಾಪಿಸುವುದು:

sudo add-apt-repository ppa: gezakovacs / pdfocr
sudo apt-get update
sudo apt-get pdfocr ಅನ್ನು ಸ್ಥಾಪಿಸಿ

Pdfocr ಅನ್ನು ಹೇಗೆ ಬಳಸುವುದು:

ಟರ್ಮಿನಲ್ ತೆರೆಯಿರಿ, ನೀವು ಪರಿವರ್ತಿಸಲು ಬಯಸುವ ಪಿಡಿಎಫ್ ಇರುವ ಡೈರೆಕ್ಟರಿಗೆ ಹೋಗಿ, ಮತ್ತು ಈ ಕೆಳಗಿನವುಗಳನ್ನು ನಮೂದಿಸಿ (ಇನ್ಪುಟ್.ಪಿಡಿಎಫ್ ಅನ್ನು ನೀವು ಪರಿವರ್ತಿಸಲು ಬಯಸುವ ಪಿಡಿಎಫ್ನೊಂದಿಗೆ ಬದಲಾಯಿಸಿ ಮತ್ತು ಹೊಸ ಫೈಲ್ ಹೆಸರಿನಿಂದ output ಟ್ಪುಟ್ ಪಿಡಿಎಫ್ ಅನ್ನು ಎಂಬೆಡೆಡ್ ಟೆಕ್ಸ್ಟ್ ಲೇಯರ್ನೊಂದಿಗೆ)

pdfocr -i input.pdf -o output.pdf

ನಿಮ್ಮ ಪಿಡಿಎಫ್‌ನ ಪ್ರತಿಯೊಂದು ಪುಟವನ್ನು ಒಸಿಆರ್ ಅಭ್ಯಾಸ ಮಾಡಲು ಮತ್ತು ಅಂತಿಮ ಮಾರ್ಪಡಿಸಿದ ಫೈಲ್ ಅನ್ನು ರಚಿಸಲು ಕಾಯಿರಿ. ನಿಮ್ಮ ಪಿಡಿಎಫ್‌ನ ರೆಸಲ್ಯೂಶನ್ ಅನ್ನು ಅವಲಂಬಿಸಿ ಇದು ಪ್ರತಿ ಪುಟಕ್ಕೆ ಕೆಲವು ಸೆಕೆಂಡುಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ.

ನಿಮ್ಮ ಅಭಿಪ್ರಾಯವನ್ನು ಬಿಡಿ

ನಿಮ್ಮ ಈಮೇಲ್ ವಿಳಾಸ ಪ್ರಕಟವಾದ ಆಗುವುದಿಲ್ಲ. ಅಗತ್ಯವಿರುವ ಜಾಗ ಗುರುತಿಸಲಾಗಿದೆ *

ಕಾಮೆಂಟ್ *

ಹೆಸರು*

ಎಲೆಕ್ಟ್ರಾನಿಕ್ ಮೇಲ್*

ನಾನು ಸ್ವೀಕರಿಸುತ್ತೇನೆ ಗೌಪ್ಯತೆ ನಿಯಮಗಳು*

ಡೇಟಾಗೆ ಜವಾಬ್ದಾರಿ: ಮಿಗುಯೆಲ್ ಏಂಜೆಲ್ ಗಟಾನ್
ಡೇಟಾದ ಉದ್ದೇಶ: ನಿಯಂತ್ರಣ SPAM, ಕಾಮೆಂಟ್ ನಿರ್ವಹಣೆ.
ಕಾನೂನುಬದ್ಧತೆ: ನಿಮ್ಮ ಒಪ್ಪಿಗೆ
ಡೇಟಾದ ಸಂವಹನ: ಕಾನೂನುಬದ್ಧ ಬಾಧ್ಯತೆಯನ್ನು ಹೊರತುಪಡಿಸಿ ಡೇಟಾವನ್ನು ಮೂರನೇ ವ್ಯಕ್ತಿಗಳಿಗೆ ಸಂವಹನ ಮಾಡಲಾಗುವುದಿಲ್ಲ.
ಡೇಟಾ ಸಂಗ್ರಹಣೆ: ಆಕ್ಸೆಂಟಸ್ ನೆಟ್‌ವರ್ಕ್‌ಗಳು (ಇಯು) ಹೋಸ್ಟ್ ಮಾಡಿದ ಡೇಟಾಬೇಸ್
ಹಕ್ಕುಗಳು: ಯಾವುದೇ ಸಮಯದಲ್ಲಿ ನೀವು ನಿಮ್ಮ ಮಾಹಿತಿಯನ್ನು ಮಿತಿಗೊಳಿಸಬಹುದು, ಮರುಪಡೆಯಬಹುದು ಮತ್ತು ಅಳಿಸಬಹುದು.

ನಾನು ಸುದ್ದಿಪತ್ರವನ್ನು ಸ್ವೀಕರಿಸಲು ಬಯಸುತ್ತೇನೆ

ರೊಡಾಲ್ಫೊ ಲಾರಾ ಡಿಜೊ
ಮಾಡುತ್ತದೆ 11 ವರ್ಷಗಳ

ರೋಡಾಲ್ಫೊ @ ರೊಡಾಲ್ಫೊ-ಡೆಸ್ಕ್‌ಟಾಪ್: ~ $ ಸುಡೋ ಆಪ್ಟ್-ಗೆಟ್ ಇನ್‌ಸ್ಟಾಲ್ ಪಿಡಿಫೋಕರ್
ಪ್ಯಾಕೇಜ್ ಪಟ್ಟಿಯನ್ನು ಓದುವುದು ... ಮುಗಿದಿದೆ
ಅವಲಂಬನೆ ಮರವನ್ನು ರಚಿಸುವುದು
ಸ್ಥಿತಿ ಮಾಹಿತಿಯನ್ನು ಓದುವುದು ... ಮುಗಿದಿದೆ
ಇ: ಪಿಡಿಫೋಕರ್ ಪ್ಯಾಕೇಜ್ ಅನ್ನು ಕಂಡುಹಿಡಿಯಲಾಗಲಿಲ್ಲ
ರೋಡಾಲ್ಫೊ @ ರೊಡಾಲ್ಫೊ-ಡೆಸ್ಕ್‌ಟಾಪ್: ~ $

ರೊಡಾಲ್ಫೊ ಲಾರಾ ಅವರಿಗೆ ಪ್ರತ್ಯುತ್ತರಿಸಿ
ಲಿನಕ್ಸ್ ಬಳಸೋಣ ಡಿಜೊ
ಮಾಡುತ್ತದೆ 11 ವರ್ಷಗಳ

ಅನುಗುಣವಾದ ಪಿಪಿಎ ಸೇರಿಸಲು ನೀವು ಖಚಿತಪಡಿಸಿದ್ದೀರಾ?
ಈ ಪಿಪಿಎ ಹಳೆಯ ಉಬುಂಟು ಆವೃತ್ತಿಗಳಿಗೆ ಪಿಡಿಫೋಕರ್ ಆವೃತ್ತಿಯನ್ನು ಹೊಂದಿದೆ. ಈ ಪೋಸ್ಟ್ ಈಗಾಗಲೇ ಹಲವಾರು ತಿಂಗಳುಗಳಷ್ಟು ಹಳೆಯದು ಎಂದು ಯೋಚಿಸಿ. ಹೇಗಾದರೂ, ಕಲ್ಪನೆಯು ಒಂದೇ ಆಗಿರುತ್ತದೆ. ಲಾಂಚ್‌ಪ್ಯಾಡ್‌ಗೆ ಹೋಗಿ ಮತ್ತು ಪಿಪಿಎಗಾಗಿ ನೋಡಿ ಅದು ಮೇವರಿಕ್‌ಗಾಗಿ ಪಿಡಿಫೋಕರ್ ಆವೃತ್ತಿಯನ್ನು ಒಳಗೊಂಡಿದೆ.
ಚೀರ್ಸ್! ಪಾಲ್.

ನಾವು ಲಿನಕ್ಸ್ ಅನ್ನು ಬಳಸೋಣ ಎಂದು ಪ್ರತಿಕ್ರಿಯಿಸಿ
ಜ್ವರೇ ಡಿಜೊ
ಮಾಡುತ್ತದೆ 11 ವರ್ಷಗಳ

ಸರಿ, ಅದು ಹೇಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ನೋಡಲು ಅದನ್ನು ಪರೀಕ್ಷಿಸುವ ವಿಷಯವಾಗಿರುತ್ತದೆ

ಜ್ವರೆಗೆ ಪ್ರತ್ಯುತ್ತರ
ಲಿನಕ್ಸ್ ಬಳಸೋಣ ಡಿಜೊ
ಮಾಡುತ್ತದೆ 11 ವರ್ಷಗಳ

ಮುಂದುವರೆಸು! ನೀವು ಯಶಸ್ವಿಯಾಗಿದ್ದರೆ ನಮಗೆ ತಿಳಿಸಿ !! ಇದು ಕೆಲಸ ಮಾಡದಿದ್ದರೆ ನಾವು ನಿಮಗೆ ಸಹಾಯ ಮಾಡಲು ಸಹ ಪ್ರಯತ್ನಿಸಬಹುದು! ಚೀರ್ಸ್! ಪಾಲ್.

ನಾವು ಲಿನಕ್ಸ್ ಅನ್ನು ಬಳಸೋಣ ಎಂದು ಪ್ರತಿಕ್ರಿಯಿಸಿ
a01653 ಡಿಜೊ
ಮಾಡುತ್ತದೆ 11 ವರ್ಷಗಳ

ಹಲೋ,
ನಾನು ಪ್ರೋಗ್ರಾಂ ಅನ್ನು ಪಿಡಿಎಫ್ನಲ್ಲಿ ಪರೀಕ್ಷಿಸಿದ್ದೇನೆ ಮತ್ತು ಫಲಿತಾಂಶವು ತುಂಬಾ ಉತ್ತಮವಾಗಿಲ್ಲ. ನಾನು ವೃತ್ತಿಪರ ಅಕ್ರೋಬ್ಯಾಟ್ 8 ಗೆ ಬಳಸುತ್ತಿದ್ದೇನೆ ಮತ್ತು ಇದೇ ರೀತಿಯದ್ದನ್ನು ಹುಡುಕುತ್ತಿದ್ದೆ. ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ ಪಿಡಿಎಫ್‌ಗಳನ್ನು ಸ್ವಚ್ clean ಗೊಳಿಸಲು ಮತ್ತು ನೇರಗೊಳಿಸಲು ಅಕ್ರೋಬ್ಯಾಟ್ ಫೈಲ್‌ಗಳಿಗೆ ಉಪಯುಕ್ತತೆಗಳನ್ನು ರವಾನಿಸುತ್ತದೆ ಮತ್ತು ಹೀಗಾಗಿ ಒಸಿಆರ್‌ಗೆ ಉತ್ತಮ ಮೂಲವನ್ನು ಪಡೆಯುತ್ತದೆ. ಇದಕ್ಕೆ ಪರಿಹಾರವಿದೆಯೇ ಎಂದು ನಿಮಗೆ ತಿಳಿದಿದೆ.

ಧನ್ಯವಾದಗಳು!

A01653 ಗೆ ಪ್ರತ್ಯುತ್ತರಿಸಿ
ಲಿನಕ್ಸ್ ಬಳಸೋಣ ಡಿಜೊ
ಮಾಡುತ್ತದೆ 11 ವರ್ಷಗಳ

ಹಲೋ! ಟೆಸ್ಸೆರಾಕ್ಟ್ ಅತ್ಯುತ್ತಮ ಓಪನ್ ಸೋರ್ಸ್ ಒಸಿಆರ್ ಎಂದು ನಾನು ಕೇಳಿದ್ದೇನೆ. ಅದು ಒಳ್ಳೆಯದು ಎಂದು ನನಗೆ ಗೊತ್ತಿಲ್ಲ. ಅಲ್ಲದೆ, ಅದು ಕೆಲಸ ಮಾಡಲು ನಿಮ್ಮ ಕೈಗಳನ್ನು ಸ್ವಲ್ಪ ಕೊಳಕುಗೊಳಿಸಬೇಕು. ಕೆಲವು ಸೂಚನೆಗಳು ಇಲ್ಲಿವೆ. ನೀವು ಯಶಸ್ವಿಯಾದರೆ, ಅದು ಕೆಲಸ ಮಾಡಿದರೆ, ಅದು ಪೋಸ್ಟ್ ಆಗುವುದಕ್ಕೆ ಕಾರಣವಾಗಬಹುದು ಎಂದು ನನಗೆ ತಿಳಿಸುವಂತೆ ನಾನು ನಿಮ್ಮನ್ನು ಬೇಡಿಕೊಳ್ಳುತ್ತೇನೆ.

ಮೊದಲು "http://download.tuxfamily.org/guadausers/guadaV2.03/" ನಿಂದ ಸಿನಾಪ್ಟಿಕ್, "xsane4tess" ಬಳಸಿ "ಟೆಸ್ಸೆರಾಕ್ಟ್ 2-4" ಮತ್ತು "ಇಮೇಜ್‌ಮ್ಯಾಜಿಕ್" ಪ್ಯಾಕೇಜ್‌ಗಳನ್ನು ಸ್ಥಾಪಿಸಿ.

ನಂತರ tmp ಫೋಲ್ಡರ್ ಅನ್ನು ಇಲ್ಲಿ ರಚಿಸಿ: / home / yourusername / tmp

ನಂತರ ಅದನ್ನು ಸಂರಚಿಸಲು Xsane ಅನ್ನು ತೆರೆಯಿರಿ, ಆದ್ಯತೆಗಳು–> ಸಂರಚನೆ–> OCR ಟ್ಯಾಬ್ ಮತ್ತು ಕೆಳಗಿನವುಗಳನ್ನು ಭರ್ತಿ ಮಾಡಿ:

OCR ಆಜ್ಞೆ -> xsane2tess -l ಸ್ಪಾ
ಇನ್ಪುಟ್ ಫೈಲ್ ಆಯ್ಕೆ -> -i
Put ಟ್ಪುಟ್ ಫೈಲ್ ಆಯ್ಕೆ -> -o
Put ಟ್ಪುಟ್ ಆಯ್ಕೆ -fd ಇಂಟರ್ಫೇಸ್ -> -x

ತಾತ್ಕಾಲಿಕ ಡೈರೆಕ್ಟರಿ ಹೇಳುವ ಭಾಗದಲ್ಲಿನ "ಉಳಿಸು" ಟ್ಯಾಬ್‌ನಲ್ಲಿನ Xsane ಸಂರಚನೆಗಳಲ್ಲಿ, ನೀವು "/ home / yourusername" ನಲ್ಲಿ ರಚಿಸಿದ "tmp" ಫೋಲ್ಡರ್ ಇದೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ.

ಉಬುಂಟುನಲ್ಲಿ ಒಸಿಆರ್ ಹೇಗೆ ಮಾಡಬೇಕೆಂಬುದರ ವಿವರಗಳೊಂದಿಗೆ ನಾನು ನಿಮಗೆ ಒಂದು ಪುಟವನ್ನು ಬಿಡುತ್ತೇನೆ: https://help.ubuntu.com/community/OCR

ನಾವು ಲಿನಕ್ಸ್ ಅನ್ನು ಬಳಸೋಣ ಎಂದು ಪ್ರತಿಕ್ರಿಯಿಸಿ
ಲಿನಕ್ಸ್ ಬಳಸೋಣ ಡಿಜೊ
ಮಾಡುತ್ತದೆ 11 ವರ್ಷಗಳ

ನಾನು x ಅನ್ನು ಕಂಡುಹಿಡಿದ ಮತ್ತೊಂದು ವಿಧಾನವೆಂದರೆ ಈ ಕೆಳಗಿನವು:

ಸ್ಕ್ಯಾನರ್ ಅನ್ನು ಈಗಾಗಲೇ ಸಂಪರ್ಕಿಸಲಾಗಿದೆ ಮತ್ತು ಸಿಸ್ಟಮ್ ಗುರುತಿಸಿದೆ ಎಂದು uming ಹಿಸಿ

1. ನಾನು ಸಿಸ್ಟಮ್> ಅಡ್ಮಿನಿಸ್ಟ್ರೇಷನ್> ಸಿನಾಪ್ಟಿಕ್ ಪ್ಯಾಕೇಜ್ ಮ್ಯಾನೇಜರ್ ಅನ್ನು ತೆರೆಯುತ್ತೇನೆ (ಗ್ನೋಮ್‌ನಲ್ಲಿ)

2. ಟೆಸ್ಸೆರಾಕ್ಟ್-ಒಕ್ಆರ್-ಸ್ಪಾ (ಸ್ಪ್ಯಾನಿಷ್ ಭಾಷೆಯಲ್ಲಿ ಸ್ಕ್ಯಾನ್ ಮಾಡಲು) ಮತ್ತು gscan2pdf ಅನ್ನು ಸ್ಥಾಪಿಸಲು ಹುಡುಕಾಟ ಮತ್ತು ಚೌಕಟ್ಟು

3. ಸ್ಕ್ಯಾನ್ ಮಾಡಲು ನಾನು ಅಪ್ಲಿಕೇಶನ್‌ಗಳು> ಗ್ರಾಫಿಕ್ಸ್> gscan2pdf ಅನ್ನು ತೆರೆಯುತ್ತೇನೆ

ಮತ್ತು ಸಿದ್ಧವಾಗಿದೆ.

ನಾವು ಲಿನಕ್ಸ್ ಅನ್ನು ಬಳಸೋಣ ಎಂದು ಪ್ರತಿಕ್ರಿಯಿಸಿ
ಟ್ರೌಬಡೋರ್ ಡಿಜೊ
ಮಾಡುತ್ತದೆ 10 ವರ್ಷಗಳ

ಹೇ ಸ್ನೇಹಿತ, ತುಂಬಾ ಧನ್ಯವಾದಗಳು, ಸತ್ಯವೆಂದರೆ ಟೆಸ್ಸೆರಾಕ್ಟ್ ಉತ್ತಮ ಸಾಧನ, ಆದರೆ "ಸಮಸ್ಯಾತ್ಮಕ" ಸ್ಕ್ಯಾನಿಂಗ್ ಹೊಂದಿರುವ ಪುಸ್ತಕಗಳಿಗೆ ಹೋಲಿಸಿದರೆ ಬಹಳ ಸೀಮಿತವಾಗಿದೆ. ಮತ್ತೊಂದೆಡೆ, ಈ ಸಾಫ್ಟ್‌ವೇರ್ ಹೆಚ್ಚು ಸುಲಭವಾಗಿ ಹೊಂದಿಕೊಳ್ಳುತ್ತದೆ ...

ಟ್ರೊವಾಡೋರ್ಡೆಬರೋಗೆ ಪ್ರತ್ಯುತ್ತರಿಸಿ
ಜುವಾನ್ ಆನೆಜ್ ಡಿಜೊ
ಮಾಡುತ್ತದೆ 10 ವರ್ಷಗಳ

ಚಿತ್ರಗಳನ್ನು ಡಿಜಿಟಲೀಕರಣಗೊಳಿಸುವ ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ, ಪಿಡಿಎಫ್-ಎ ಫೈಲ್‌ಗಳನ್ನು ಪರಿವರ್ತಿಸಲಾಗುತ್ತಿದೆ, ಅವುಗಳನ್ನು ಒಸಿಆರ್ಡ್ ಮಾಡಬೇಕು. ಬ್ಲ್ಯಾಕ್ & ವೈಟ್ ಅಥವಾ ಗ್ರೇಸ್ಕೇಲ್ನಲ್ಲಿ ಸ್ಕ್ಯಾನ್ ಮಾಡುವುದು ಫಲಿತಾಂಶಕ್ಕೆ ಎಷ್ಟು ಸೂಕ್ಷ್ಮವಾಗಿರುತ್ತದೆ? ಏನು ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ?

ಜುವಾನ್ ಆನೆಜ್ಗೆ ಪ್ರತ್ಯುತ್ತರಿಸಿ

ನಿಮ್ಮ ಅಭಿಪ್ರಾಯವನ್ನು ಬಿಡಿ ಉತ್ತರವನ್ನು ರದ್ದುಮಾಡಿ

ನಿಮ್ಮ ಅಭಿಪ್ರಾಯವನ್ನು ಬಿಡಿ