ನಿಮ್ಮಲ್ಲಿ ಸ್ಕ್ಯಾನರ್ ಬಳಸಿ ರಚಿಸಲಾದ ಪಿಡಿಎಫ್ ಇದೆ ಎಂದು ಭಾವಿಸೋಣ ಅಥವಾ ಅವರು ಅದನ್ನು ನಿಮಗೆ ರವಾನಿಸಿದ್ದಾರೆ ಆದರೆ ಅದು ಚಿತ್ರದ ರೂಪದಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಹೊಂದಿರುತ್ತದೆ. ನಮ್ಮ ಪ್ರೀತಿಯ ಪಿಡಿಎಫ್ ಅನ್ನು ನಾವು ಸಲ್ಲಿಸಬೇಕಾದ ವಿಧಾನವನ್ನು ಕರೆಯಲಾಗುತ್ತದೆ ಒಸಿಆರ್: ಒಂದು ಪಠ್ಯ ವರ್ಣಮಾಲೆಗೆ ಸೇರಿದ ಚಿಹ್ನೆಗಳು ಅಥವಾ ಅಕ್ಷರಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಗುರುತಿಸುವ ಪ್ರಕ್ರಿಯೆ, ಚಿತ್ರದಿಂದ ಅದನ್ನು ಡೇಟಾ ರೂಪದಲ್ಲಿ ಸಂಗ್ರಹಿಸಲು ನಾವು ಪಠ್ಯ ಸಂಪಾದನೆ ಕಾರ್ಯಕ್ರಮದ ಮೂಲಕ ಅಥವಾ ಅಂತಹುದೇ ಸಂವಹನ ನಡೆಸಬಹುದು. |
pdfocr ಎನ್ನುವುದು ಸರಳವಾದ ಸಾಧನವಾಗಿದ್ದು ಅದು ಹೊಸ ಪಿಡಿಎಫ್ ಅನ್ನು ಎಂಬೆಡೆಡ್ ಟೆಕ್ಸ್ಟ್ ಲೇಯರ್ನೊಂದಿಗೆ ರಚಿಸುತ್ತದೆ, ಇದು ಪಿಡಿಎಫ್ನ ಅಂತಿಮ ನೋಟವನ್ನು ಬದಲಾಯಿಸದೆ ಪಠ್ಯವನ್ನು ಆಯ್ಕೆ ಮಾಡಲು ಮತ್ತು ಅದರಲ್ಲಿ ಪದಗಳನ್ನು ಹುಡುಕಲು ಬಳಕೆದಾರರಿಗೆ ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ.
ಯಾವ ಪಿಡಿಫೋಕರ್ ಇದಕ್ಕಾಗಿ ಅಲ್ಲ:
ಪಿಡಿಎಫ್ ಚಿತ್ರ ರೂಪದಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಹೊಂದಿದ್ದರೆ ಮಾತ್ರ ಇದು ಉಪಯುಕ್ತವಾಗಿರುತ್ತದೆ; ನೀವು ಓಪನ್ ಆಫೀಸ್ನಿಂದ ಪಿಡಿಎಫ್ ಅನ್ನು ರಫ್ತು ಮಾಡಿದರೆ, ಅದು ಈಗಾಗಲೇ ಎಂಬೆಡೆಡ್ ಪಠ್ಯ ಪದರವನ್ನು ಹೊಂದಿದೆ, ಆದ್ದರಿಂದ ಈ ವಿಧಾನವು ಅನಗತ್ಯವಾಗಿದೆ.
Pdfocr ಅನ್ನು ಹೇಗೆ ಸ್ಥಾಪಿಸುವುದು:
sudo add-apt-repository ppa: gezakovacs / pdfocr
sudo apt-get update
sudo apt-get pdfocr ಅನ್ನು ಸ್ಥಾಪಿಸಿ
Pdfocr ಅನ್ನು ಹೇಗೆ ಬಳಸುವುದು:
ಟರ್ಮಿನಲ್ ತೆರೆಯಿರಿ, ನೀವು ಪರಿವರ್ತಿಸಲು ಬಯಸುವ ಪಿಡಿಎಫ್ ಇರುವ ಡೈರೆಕ್ಟರಿಗೆ ಹೋಗಿ, ಮತ್ತು ಈ ಕೆಳಗಿನವುಗಳನ್ನು ನಮೂದಿಸಿ (ಇನ್ಪುಟ್.ಪಿಡಿಎಫ್ ಅನ್ನು ನೀವು ಪರಿವರ್ತಿಸಲು ಬಯಸುವ ಪಿಡಿಎಫ್ನೊಂದಿಗೆ ಬದಲಾಯಿಸಿ ಮತ್ತು ಹೊಸ ಫೈಲ್ ಹೆಸರಿನಿಂದ output ಟ್ಪುಟ್ ಪಿಡಿಎಫ್ ಅನ್ನು ಎಂಬೆಡೆಡ್ ಟೆಕ್ಸ್ಟ್ ಲೇಯರ್ನೊಂದಿಗೆ)
pdfocr -i input.pdf -o output.pdf
ನಿಮ್ಮ ಪಿಡಿಎಫ್ನ ಪ್ರತಿಯೊಂದು ಪುಟವನ್ನು ಒಸಿಆರ್ ಅಭ್ಯಾಸ ಮಾಡಲು ಮತ್ತು ಅಂತಿಮ ಮಾರ್ಪಡಿಸಿದ ಫೈಲ್ ಅನ್ನು ರಚಿಸಲು ಕಾಯಿರಿ. ನಿಮ್ಮ ಪಿಡಿಎಫ್ನ ರೆಸಲ್ಯೂಶನ್ ಅನ್ನು ಅವಲಂಬಿಸಿ ಇದು ಪ್ರತಿ ಪುಟಕ್ಕೆ ಕೆಲವು ಸೆಕೆಂಡುಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ.
ರೋಡಾಲ್ಫೊ @ ರೊಡಾಲ್ಫೊ-ಡೆಸ್ಕ್ಟಾಪ್: ~ $ ಸುಡೋ ಆಪ್ಟ್-ಗೆಟ್ ಇನ್ಸ್ಟಾಲ್ ಪಿಡಿಫೋಕರ್
ಪ್ಯಾಕೇಜ್ ಪಟ್ಟಿಯನ್ನು ಓದುವುದು ... ಮುಗಿದಿದೆ
ಅವಲಂಬನೆ ಮರವನ್ನು ರಚಿಸುವುದು
ಸ್ಥಿತಿ ಮಾಹಿತಿಯನ್ನು ಓದುವುದು ... ಮುಗಿದಿದೆ
ಇ: ಪಿಡಿಫೋಕರ್ ಪ್ಯಾಕೇಜ್ ಅನ್ನು ಕಂಡುಹಿಡಿಯಲಾಗಲಿಲ್ಲ
ರೋಡಾಲ್ಫೊ @ ರೊಡಾಲ್ಫೊ-ಡೆಸ್ಕ್ಟಾಪ್: ~ $
ಅನುಗುಣವಾದ ಪಿಪಿಎ ಸೇರಿಸಲು ನೀವು ಖಚಿತಪಡಿಸಿದ್ದೀರಾ?
ಈ ಪಿಪಿಎ ಹಳೆಯ ಉಬುಂಟು ಆವೃತ್ತಿಗಳಿಗೆ ಪಿಡಿಫೋಕರ್ ಆವೃತ್ತಿಯನ್ನು ಹೊಂದಿದೆ. ಈ ಪೋಸ್ಟ್ ಈಗಾಗಲೇ ಹಲವಾರು ತಿಂಗಳುಗಳಷ್ಟು ಹಳೆಯದು ಎಂದು ಯೋಚಿಸಿ. ಹೇಗಾದರೂ, ಕಲ್ಪನೆಯು ಒಂದೇ ಆಗಿರುತ್ತದೆ. ಲಾಂಚ್ಪ್ಯಾಡ್ಗೆ ಹೋಗಿ ಮತ್ತು ಪಿಪಿಎಗಾಗಿ ನೋಡಿ ಅದು ಮೇವರಿಕ್ಗಾಗಿ ಪಿಡಿಫೋಕರ್ ಆವೃತ್ತಿಯನ್ನು ಒಳಗೊಂಡಿದೆ.
ಚೀರ್ಸ್! ಪಾಲ್.
ಸರಿ, ಅದು ಹೇಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ನೋಡಲು ಅದನ್ನು ಪರೀಕ್ಷಿಸುವ ವಿಷಯವಾಗಿರುತ್ತದೆ
ಮುಂದುವರೆಸು! ನೀವು ಯಶಸ್ವಿಯಾಗಿದ್ದರೆ ನಮಗೆ ತಿಳಿಸಿ !! ಇದು ಕೆಲಸ ಮಾಡದಿದ್ದರೆ ನಾವು ನಿಮಗೆ ಸಹಾಯ ಮಾಡಲು ಸಹ ಪ್ರಯತ್ನಿಸಬಹುದು! ಚೀರ್ಸ್! ಪಾಲ್.
ಹಲೋ,
ನಾನು ಪ್ರೋಗ್ರಾಂ ಅನ್ನು ಪಿಡಿಎಫ್ನಲ್ಲಿ ಪರೀಕ್ಷಿಸಿದ್ದೇನೆ ಮತ್ತು ಫಲಿತಾಂಶವು ತುಂಬಾ ಉತ್ತಮವಾಗಿಲ್ಲ. ನಾನು ವೃತ್ತಿಪರ ಅಕ್ರೋಬ್ಯಾಟ್ 8 ಗೆ ಬಳಸುತ್ತಿದ್ದೇನೆ ಮತ್ತು ಇದೇ ರೀತಿಯದ್ದನ್ನು ಹುಡುಕುತ್ತಿದ್ದೆ. ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ ಪಿಡಿಎಫ್ಗಳನ್ನು ಸ್ವಚ್ clean ಗೊಳಿಸಲು ಮತ್ತು ನೇರಗೊಳಿಸಲು ಅಕ್ರೋಬ್ಯಾಟ್ ಫೈಲ್ಗಳಿಗೆ ಉಪಯುಕ್ತತೆಗಳನ್ನು ರವಾನಿಸುತ್ತದೆ ಮತ್ತು ಹೀಗಾಗಿ ಒಸಿಆರ್ಗೆ ಉತ್ತಮ ಮೂಲವನ್ನು ಪಡೆಯುತ್ತದೆ. ಇದಕ್ಕೆ ಪರಿಹಾರವಿದೆಯೇ ಎಂದು ನಿಮಗೆ ತಿಳಿದಿದೆ.
ಧನ್ಯವಾದಗಳು!
ಹಲೋ! ಟೆಸ್ಸೆರಾಕ್ಟ್ ಅತ್ಯುತ್ತಮ ಓಪನ್ ಸೋರ್ಸ್ ಒಸಿಆರ್ ಎಂದು ನಾನು ಕೇಳಿದ್ದೇನೆ. ಅದು ಒಳ್ಳೆಯದು ಎಂದು ನನಗೆ ಗೊತ್ತಿಲ್ಲ. ಅಲ್ಲದೆ, ಅದು ಕೆಲಸ ಮಾಡಲು ನಿಮ್ಮ ಕೈಗಳನ್ನು ಸ್ವಲ್ಪ ಕೊಳಕುಗೊಳಿಸಬೇಕು. ಕೆಲವು ಸೂಚನೆಗಳು ಇಲ್ಲಿವೆ. ನೀವು ಯಶಸ್ವಿಯಾದರೆ, ಅದು ಕೆಲಸ ಮಾಡಿದರೆ, ಅದು ಪೋಸ್ಟ್ ಆಗುವುದಕ್ಕೆ ಕಾರಣವಾಗಬಹುದು ಎಂದು ನನಗೆ ತಿಳಿಸುವಂತೆ ನಾನು ನಿಮ್ಮನ್ನು ಬೇಡಿಕೊಳ್ಳುತ್ತೇನೆ.
ಮೊದಲು "http://download.tuxfamily.org/guadausers/guadaV2.03/" ನಿಂದ ಸಿನಾಪ್ಟಿಕ್, "xsane4tess" ಬಳಸಿ "ಟೆಸ್ಸೆರಾಕ್ಟ್ 2-4" ಮತ್ತು "ಇಮೇಜ್ಮ್ಯಾಜಿಕ್" ಪ್ಯಾಕೇಜ್ಗಳನ್ನು ಸ್ಥಾಪಿಸಿ.
ನಂತರ tmp ಫೋಲ್ಡರ್ ಅನ್ನು ಇಲ್ಲಿ ರಚಿಸಿ: / home / yourusername / tmp
ನಂತರ ಅದನ್ನು ಸಂರಚಿಸಲು Xsane ಅನ್ನು ತೆರೆಯಿರಿ, ಆದ್ಯತೆಗಳು–> ಸಂರಚನೆ–> OCR ಟ್ಯಾಬ್ ಮತ್ತು ಕೆಳಗಿನವುಗಳನ್ನು ಭರ್ತಿ ಮಾಡಿ:
OCR ಆಜ್ಞೆ -> xsane2tess -l ಸ್ಪಾ
ಇನ್ಪುಟ್ ಫೈಲ್ ಆಯ್ಕೆ -> -i
Put ಟ್ಪುಟ್ ಫೈಲ್ ಆಯ್ಕೆ -> -o
Put ಟ್ಪುಟ್ ಆಯ್ಕೆ -fd ಇಂಟರ್ಫೇಸ್ -> -x
ತಾತ್ಕಾಲಿಕ ಡೈರೆಕ್ಟರಿ ಹೇಳುವ ಭಾಗದಲ್ಲಿನ "ಉಳಿಸು" ಟ್ಯಾಬ್ನಲ್ಲಿನ Xsane ಸಂರಚನೆಗಳಲ್ಲಿ, ನೀವು "/ home / yourusername" ನಲ್ಲಿ ರಚಿಸಿದ "tmp" ಫೋಲ್ಡರ್ ಇದೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ.
ಉಬುಂಟುನಲ್ಲಿ ಒಸಿಆರ್ ಹೇಗೆ ಮಾಡಬೇಕೆಂಬುದರ ವಿವರಗಳೊಂದಿಗೆ ನಾನು ನಿಮಗೆ ಒಂದು ಪುಟವನ್ನು ಬಿಡುತ್ತೇನೆ: https://help.ubuntu.com/community/OCR
ನಾನು x ಅನ್ನು ಕಂಡುಹಿಡಿದ ಮತ್ತೊಂದು ವಿಧಾನವೆಂದರೆ ಈ ಕೆಳಗಿನವು:
ಸ್ಕ್ಯಾನರ್ ಅನ್ನು ಈಗಾಗಲೇ ಸಂಪರ್ಕಿಸಲಾಗಿದೆ ಮತ್ತು ಸಿಸ್ಟಮ್ ಗುರುತಿಸಿದೆ ಎಂದು uming ಹಿಸಿ
1. ನಾನು ಸಿಸ್ಟಮ್> ಅಡ್ಮಿನಿಸ್ಟ್ರೇಷನ್> ಸಿನಾಪ್ಟಿಕ್ ಪ್ಯಾಕೇಜ್ ಮ್ಯಾನೇಜರ್ ಅನ್ನು ತೆರೆಯುತ್ತೇನೆ (ಗ್ನೋಮ್ನಲ್ಲಿ)
2. ಟೆಸ್ಸೆರಾಕ್ಟ್-ಒಕ್ಆರ್-ಸ್ಪಾ (ಸ್ಪ್ಯಾನಿಷ್ ಭಾಷೆಯಲ್ಲಿ ಸ್ಕ್ಯಾನ್ ಮಾಡಲು) ಮತ್ತು gscan2pdf ಅನ್ನು ಸ್ಥಾಪಿಸಲು ಹುಡುಕಾಟ ಮತ್ತು ಚೌಕಟ್ಟು
3. ಸ್ಕ್ಯಾನ್ ಮಾಡಲು ನಾನು ಅಪ್ಲಿಕೇಶನ್ಗಳು> ಗ್ರಾಫಿಕ್ಸ್> gscan2pdf ಅನ್ನು ತೆರೆಯುತ್ತೇನೆ
ಮತ್ತು ಸಿದ್ಧವಾಗಿದೆ.
ಹೇ ಸ್ನೇಹಿತ, ತುಂಬಾ ಧನ್ಯವಾದಗಳು, ಸತ್ಯವೆಂದರೆ ಟೆಸ್ಸೆರಾಕ್ಟ್ ಉತ್ತಮ ಸಾಧನ, ಆದರೆ "ಸಮಸ್ಯಾತ್ಮಕ" ಸ್ಕ್ಯಾನಿಂಗ್ ಹೊಂದಿರುವ ಪುಸ್ತಕಗಳಿಗೆ ಹೋಲಿಸಿದರೆ ಬಹಳ ಸೀಮಿತವಾಗಿದೆ. ಮತ್ತೊಂದೆಡೆ, ಈ ಸಾಫ್ಟ್ವೇರ್ ಹೆಚ್ಚು ಸುಲಭವಾಗಿ ಹೊಂದಿಕೊಳ್ಳುತ್ತದೆ ...
ಚಿತ್ರಗಳನ್ನು ಡಿಜಿಟಲೀಕರಣಗೊಳಿಸುವ ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ, ಪಿಡಿಎಫ್-ಎ ಫೈಲ್ಗಳನ್ನು ಪರಿವರ್ತಿಸಲಾಗುತ್ತಿದೆ, ಅವುಗಳನ್ನು ಒಸಿಆರ್ಡ್ ಮಾಡಬೇಕು. ಬ್ಲ್ಯಾಕ್ & ವೈಟ್ ಅಥವಾ ಗ್ರೇಸ್ಕೇಲ್ನಲ್ಲಿ ಸ್ಕ್ಯಾನ್ ಮಾಡುವುದು ಫಲಿತಾಂಶಕ್ಕೆ ಎಷ್ಟು ಸೂಕ್ಷ್ಮವಾಗಿರುತ್ತದೆ? ಏನು ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ?