ಪಿಡಿಎಫ್ ಅನ್ನು ಒಸಿಆರ್ ಮಾಡುವುದು ಹೇಗೆ ಮತ್ತು ಪಠ್ಯ ಆಯ್ಕೆ ಮತ್ತು ಹುಡುಕಾಟವನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುವುದು

ನಿಮ್ಮಲ್ಲಿ ಸ್ಕ್ಯಾನರ್ ಬಳಸಿ ರಚಿಸಲಾದ ಪಿಡಿಎಫ್ ಇದೆ ಎಂದು ಭಾವಿಸೋಣ ಅಥವಾ ಅವರು ಅದನ್ನು ನಿಮಗೆ ರವಾನಿಸಿದ್ದಾರೆ ಆದರೆ ಅದು ಚಿತ್ರದ ರೂಪದಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಹೊಂದಿರುತ್ತದೆ. ನಮ್ಮ ಪ್ರೀತಿಯ ಪಿಡಿಎಫ್ ಅನ್ನು ನಾವು ಸಲ್ಲಿಸಬೇಕಾದ ವಿಧಾನವನ್ನು ಕರೆಯಲಾಗುತ್ತದೆ ಒಸಿಆರ್: ಒಂದು ಪಠ್ಯ ವರ್ಣಮಾಲೆಗೆ ಸೇರಿದ ಚಿಹ್ನೆಗಳು ಅಥವಾ ಅಕ್ಷರಗಳನ್ನು ಸ್ವಯಂಚಾಲಿತವಾಗಿ ಗುರುತಿಸುವ ಪ್ರಕ್ರಿಯೆ, ಚಿತ್ರದಿಂದ ಅದನ್ನು ಡೇಟಾ ರೂಪದಲ್ಲಿ ಸಂಗ್ರಹಿಸಲು ನಾವು ಪಠ್ಯ ಸಂಪಾದನೆ ಕಾರ್ಯಕ್ರಮದ ಮೂಲಕ ಅಥವಾ ಅಂತಹುದೇ ಸಂವಹನ ನಡೆಸಬಹುದು.


pdfocr ಎನ್ನುವುದು ಸರಳವಾದ ಸಾಧನವಾಗಿದ್ದು ಅದು ಹೊಸ ಪಿಡಿಎಫ್ ಅನ್ನು ಎಂಬೆಡೆಡ್ ಟೆಕ್ಸ್ಟ್ ಲೇಯರ್ನೊಂದಿಗೆ ರಚಿಸುತ್ತದೆ, ಇದು ಪಿಡಿಎಫ್ನ ಅಂತಿಮ ನೋಟವನ್ನು ಬದಲಾಯಿಸದೆ ಪಠ್ಯವನ್ನು ಆಯ್ಕೆ ಮಾಡಲು ಮತ್ತು ಅದರಲ್ಲಿ ಪದಗಳನ್ನು ಹುಡುಕಲು ಬಳಕೆದಾರರಿಗೆ ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ.

ಯಾವ ಪಿಡಿಫೋಕರ್ ಇದಕ್ಕಾಗಿ ಅಲ್ಲ:

ಪಿಡಿಎಫ್ ಚಿತ್ರ ರೂಪದಲ್ಲಿ ಮಾಹಿತಿಯನ್ನು ಹೊಂದಿದ್ದರೆ ಮಾತ್ರ ಇದು ಉಪಯುಕ್ತವಾಗಿರುತ್ತದೆ; ನೀವು ಓಪನ್ ಆಫೀಸ್‌ನಿಂದ ಪಿಡಿಎಫ್ ಅನ್ನು ರಫ್ತು ಮಾಡಿದರೆ, ಅದು ಈಗಾಗಲೇ ಎಂಬೆಡೆಡ್ ಪಠ್ಯ ಪದರವನ್ನು ಹೊಂದಿದೆ, ಆದ್ದರಿಂದ ಈ ವಿಧಾನವು ಅನಗತ್ಯವಾಗಿದೆ.

Pdfocr ಅನ್ನು ಹೇಗೆ ಸ್ಥಾಪಿಸುವುದು:

sudo add-apt-repository ppa: gezakovacs / pdfocr
sudo apt-get update
sudo apt-get pdfocr ಅನ್ನು ಸ್ಥಾಪಿಸಿ

Pdfocr ಅನ್ನು ಹೇಗೆ ಬಳಸುವುದು:

ಟರ್ಮಿನಲ್ ತೆರೆಯಿರಿ, ನೀವು ಪರಿವರ್ತಿಸಲು ಬಯಸುವ ಪಿಡಿಎಫ್ ಇರುವ ಡೈರೆಕ್ಟರಿಗೆ ಹೋಗಿ, ಮತ್ತು ಈ ಕೆಳಗಿನವುಗಳನ್ನು ನಮೂದಿಸಿ (ಇನ್ಪುಟ್.ಪಿಡಿಎಫ್ ಅನ್ನು ನೀವು ಪರಿವರ್ತಿಸಲು ಬಯಸುವ ಪಿಡಿಎಫ್ನೊಂದಿಗೆ ಬದಲಾಯಿಸಿ ಮತ್ತು ಹೊಸ ಫೈಲ್ ಹೆಸರಿನಿಂದ output ಟ್ಪುಟ್ ಪಿಡಿಎಫ್ ಅನ್ನು ಎಂಬೆಡೆಡ್ ಟೆಕ್ಸ್ಟ್ ಲೇಯರ್ನೊಂದಿಗೆ)

pdfocr -i input.pdf -o output.pdf

ನಿಮ್ಮ ಪಿಡಿಎಫ್‌ನ ಪ್ರತಿಯೊಂದು ಪುಟವನ್ನು ಒಸಿಆರ್ ಅಭ್ಯಾಸ ಮಾಡಲು ಮತ್ತು ಅಂತಿಮ ಮಾರ್ಪಡಿಸಿದ ಫೈಲ್ ಅನ್ನು ರಚಿಸಲು ಕಾಯಿರಿ. ನಿಮ್ಮ ಪಿಡಿಎಫ್‌ನ ರೆಸಲ್ಯೂಶನ್ ಅನ್ನು ಅವಲಂಬಿಸಿ ಇದು ಪ್ರತಿ ಪುಟಕ್ಕೆ ಕೆಲವು ಸೆಕೆಂಡುಗಳನ್ನು ತೆಗೆದುಕೊಳ್ಳುತ್ತದೆ.


ನಿಮ್ಮ ಅಭಿಪ್ರಾಯವನ್ನು ಬಿಡಿ

ನಿಮ್ಮ ಈಮೇಲ್ ವಿಳಾಸ ಪ್ರಕಟವಾದ ಆಗುವುದಿಲ್ಲ. ಅಗತ್ಯವಿರುವ ಜಾಗ ಗುರುತಿಸಲಾಗಿದೆ *

*

*

  1. ಡೇಟಾಗೆ ಜವಾಬ್ದಾರಿ: ಮಿಗುಯೆಲ್ ಏಂಜೆಲ್ ಗಟಾನ್
  2. ಡೇಟಾದ ಉದ್ದೇಶ: ನಿಯಂತ್ರಣ SPAM, ಕಾಮೆಂಟ್ ನಿರ್ವಹಣೆ.
  3. ಕಾನೂನುಬದ್ಧತೆ: ನಿಮ್ಮ ಒಪ್ಪಿಗೆ
  4. ಡೇಟಾದ ಸಂವಹನ: ಕಾನೂನುಬದ್ಧ ಬಾಧ್ಯತೆಯನ್ನು ಹೊರತುಪಡಿಸಿ ಡೇಟಾವನ್ನು ಮೂರನೇ ವ್ಯಕ್ತಿಗಳಿಗೆ ಸಂವಹನ ಮಾಡಲಾಗುವುದಿಲ್ಲ.
  5. ಡೇಟಾ ಸಂಗ್ರಹಣೆ: ಆಕ್ಸೆಂಟಸ್ ನೆಟ್‌ವರ್ಕ್‌ಗಳು (ಇಯು) ಹೋಸ್ಟ್ ಮಾಡಿದ ಡೇಟಾಬೇಸ್
  6. ಹಕ್ಕುಗಳು: ಯಾವುದೇ ಸಮಯದಲ್ಲಿ ನೀವು ನಿಮ್ಮ ಮಾಹಿತಿಯನ್ನು ಮಿತಿಗೊಳಿಸಬಹುದು, ಮರುಪಡೆಯಬಹುದು ಮತ್ತು ಅಳಿಸಬಹುದು.

  1.   ರೊಡಾಲ್ಫೊ ಲಾರಾ ಡಿಜೊ

    ರೋಡಾಲ್ಫೊ @ ರೊಡಾಲ್ಫೊ-ಡೆಸ್ಕ್‌ಟಾಪ್: ~ $ ಸುಡೋ ಆಪ್ಟ್-ಗೆಟ್ ಇನ್‌ಸ್ಟಾಲ್ ಪಿಡಿಫೋಕರ್
    ಪ್ಯಾಕೇಜ್ ಪಟ್ಟಿಯನ್ನು ಓದುವುದು ... ಮುಗಿದಿದೆ
    ಅವಲಂಬನೆ ಮರವನ್ನು ರಚಿಸುವುದು
    ಸ್ಥಿತಿ ಮಾಹಿತಿಯನ್ನು ಓದುವುದು ... ಮುಗಿದಿದೆ
    ಇ: ಪಿಡಿಫೋಕರ್ ಪ್ಯಾಕೇಜ್ ಅನ್ನು ಕಂಡುಹಿಡಿಯಲಾಗಲಿಲ್ಲ
    ರೋಡಾಲ್ಫೊ @ ರೊಡಾಲ್ಫೊ-ಡೆಸ್ಕ್‌ಟಾಪ್: ~ $

  2.   ಲಿನಕ್ಸ್ ಬಳಸೋಣ ಡಿಜೊ

    ಅನುಗುಣವಾದ ಪಿಪಿಎ ಸೇರಿಸಲು ನೀವು ಖಚಿತಪಡಿಸಿದ್ದೀರಾ?
    ಈ ಪಿಪಿಎ ಹಳೆಯ ಉಬುಂಟು ಆವೃತ್ತಿಗಳಿಗೆ ಪಿಡಿಫೋಕರ್ ಆವೃತ್ತಿಯನ್ನು ಹೊಂದಿದೆ. ಈ ಪೋಸ್ಟ್ ಈಗಾಗಲೇ ಹಲವಾರು ತಿಂಗಳುಗಳಷ್ಟು ಹಳೆಯದು ಎಂದು ಯೋಚಿಸಿ. ಹೇಗಾದರೂ, ಕಲ್ಪನೆಯು ಒಂದೇ ಆಗಿರುತ್ತದೆ. ಲಾಂಚ್‌ಪ್ಯಾಡ್‌ಗೆ ಹೋಗಿ ಮತ್ತು ಪಿಪಿಎಗಾಗಿ ನೋಡಿ ಅದು ಮೇವರಿಕ್‌ಗಾಗಿ ಪಿಡಿಫೋಕರ್ ಆವೃತ್ತಿಯನ್ನು ಒಳಗೊಂಡಿದೆ.
    ಚೀರ್ಸ್! ಪಾಲ್.

  3.   ಜ್ವರೇ ಡಿಜೊ

    ಸರಿ, ಅದು ಹೇಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ನೋಡಲು ಅದನ್ನು ಪರೀಕ್ಷಿಸುವ ವಿಷಯವಾಗಿರುತ್ತದೆ

  4.   ಲಿನಕ್ಸ್ ಬಳಸೋಣ ಡಿಜೊ

    ಮುಂದುವರೆಸು! ನೀವು ಯಶಸ್ವಿಯಾಗಿದ್ದರೆ ನಮಗೆ ತಿಳಿಸಿ !! ಇದು ಕೆಲಸ ಮಾಡದಿದ್ದರೆ ನಾವು ನಿಮಗೆ ಸಹಾಯ ಮಾಡಲು ಸಹ ಪ್ರಯತ್ನಿಸಬಹುದು! ಚೀರ್ಸ್! ಪಾಲ್.

  5.   a01653 ಡಿಜೊ

    ಹಲೋ,
    ನಾನು ಪ್ರೋಗ್ರಾಂ ಅನ್ನು ಪಿಡಿಎಫ್ನಲ್ಲಿ ಪರೀಕ್ಷಿಸಿದ್ದೇನೆ ಮತ್ತು ಫಲಿತಾಂಶವು ತುಂಬಾ ಉತ್ತಮವಾಗಿಲ್ಲ. ನಾನು ವೃತ್ತಿಪರ ಅಕ್ರೋಬ್ಯಾಟ್ 8 ಗೆ ಬಳಸುತ್ತಿದ್ದೇನೆ ಮತ್ತು ಇದೇ ರೀತಿಯದ್ದನ್ನು ಹುಡುಕುತ್ತಿದ್ದೆ. ಸ್ಕ್ಯಾನ್ ಮಾಡಿದ ಪಿಡಿಎಫ್‌ಗಳನ್ನು ಸ್ವಚ್ clean ಗೊಳಿಸಲು ಮತ್ತು ನೇರಗೊಳಿಸಲು ಅಕ್ರೋಬ್ಯಾಟ್ ಫೈಲ್‌ಗಳಿಗೆ ಉಪಯುಕ್ತತೆಗಳನ್ನು ರವಾನಿಸುತ್ತದೆ ಮತ್ತು ಹೀಗಾಗಿ ಒಸಿಆರ್‌ಗೆ ಉತ್ತಮ ಮೂಲವನ್ನು ಪಡೆಯುತ್ತದೆ. ಇದಕ್ಕೆ ಪರಿಹಾರವಿದೆಯೇ ಎಂದು ನಿಮಗೆ ತಿಳಿದಿದೆ.

    ಧನ್ಯವಾದಗಳು!

  6.   ಲಿನಕ್ಸ್ ಬಳಸೋಣ ಡಿಜೊ

    ಹಲೋ! ಟೆಸ್ಸೆರಾಕ್ಟ್ ಅತ್ಯುತ್ತಮ ಓಪನ್ ಸೋರ್ಸ್ ಒಸಿಆರ್ ಎಂದು ನಾನು ಕೇಳಿದ್ದೇನೆ. ಅದು ಒಳ್ಳೆಯದು ಎಂದು ನನಗೆ ಗೊತ್ತಿಲ್ಲ. ಅಲ್ಲದೆ, ಅದು ಕೆಲಸ ಮಾಡಲು ನಿಮ್ಮ ಕೈಗಳನ್ನು ಸ್ವಲ್ಪ ಕೊಳಕುಗೊಳಿಸಬೇಕು. ಕೆಲವು ಸೂಚನೆಗಳು ಇಲ್ಲಿವೆ. ನೀವು ಯಶಸ್ವಿಯಾದರೆ, ಅದು ಕೆಲಸ ಮಾಡಿದರೆ, ಅದು ಪೋಸ್ಟ್ ಆಗುವುದಕ್ಕೆ ಕಾರಣವಾಗಬಹುದು ಎಂದು ನನಗೆ ತಿಳಿಸುವಂತೆ ನಾನು ನಿಮ್ಮನ್ನು ಬೇಡಿಕೊಳ್ಳುತ್ತೇನೆ.

    ಮೊದಲು "http://download.tuxfamily.org/guadausers/guadaV2.03/" ನಿಂದ ಸಿನಾಪ್ಟಿಕ್, "xsane4tess" ಬಳಸಿ "ಟೆಸ್ಸೆರಾಕ್ಟ್ 2-4" ಮತ್ತು "ಇಮೇಜ್‌ಮ್ಯಾಜಿಕ್" ಪ್ಯಾಕೇಜ್‌ಗಳನ್ನು ಸ್ಥಾಪಿಸಿ.

    ನಂತರ tmp ಫೋಲ್ಡರ್ ಅನ್ನು ಇಲ್ಲಿ ರಚಿಸಿ: / home / yourusername / tmp

    ನಂತರ ಅದನ್ನು ಸಂರಚಿಸಲು Xsane ಅನ್ನು ತೆರೆಯಿರಿ, ಆದ್ಯತೆಗಳು–> ಸಂರಚನೆ–> OCR ಟ್ಯಾಬ್ ಮತ್ತು ಕೆಳಗಿನವುಗಳನ್ನು ಭರ್ತಿ ಮಾಡಿ:

    OCR ಆಜ್ಞೆ -> xsane2tess -l ಸ್ಪಾ
    ಇನ್ಪುಟ್ ಫೈಲ್ ಆಯ್ಕೆ -> -i
    Put ಟ್ಪುಟ್ ಫೈಲ್ ಆಯ್ಕೆ -> -o
    Put ಟ್ಪುಟ್ ಆಯ್ಕೆ -fd ಇಂಟರ್ಫೇಸ್ -> -x

    ತಾತ್ಕಾಲಿಕ ಡೈರೆಕ್ಟರಿ ಹೇಳುವ ಭಾಗದಲ್ಲಿನ "ಉಳಿಸು" ಟ್ಯಾಬ್‌ನಲ್ಲಿನ Xsane ಸಂರಚನೆಗಳಲ್ಲಿ, ನೀವು "/ home / yourusername" ನಲ್ಲಿ ರಚಿಸಿದ "tmp" ಫೋಲ್ಡರ್ ಇದೆ ಎಂದು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಿ.

    ಉಬುಂಟುನಲ್ಲಿ ಒಸಿಆರ್ ಹೇಗೆ ಮಾಡಬೇಕೆಂಬುದರ ವಿವರಗಳೊಂದಿಗೆ ನಾನು ನಿಮಗೆ ಒಂದು ಪುಟವನ್ನು ಬಿಡುತ್ತೇನೆ: https://help.ubuntu.com/community/OCR

  7.   ಲಿನಕ್ಸ್ ಬಳಸೋಣ ಡಿಜೊ

    ನಾನು x ಅನ್ನು ಕಂಡುಹಿಡಿದ ಮತ್ತೊಂದು ವಿಧಾನವೆಂದರೆ ಈ ಕೆಳಗಿನವು:

    ಸ್ಕ್ಯಾನರ್ ಅನ್ನು ಈಗಾಗಲೇ ಸಂಪರ್ಕಿಸಲಾಗಿದೆ ಮತ್ತು ಸಿಸ್ಟಮ್ ಗುರುತಿಸಿದೆ ಎಂದು uming ಹಿಸಿ

    1. ನಾನು ಸಿಸ್ಟಮ್> ಅಡ್ಮಿನಿಸ್ಟ್ರೇಷನ್> ಸಿನಾಪ್ಟಿಕ್ ಪ್ಯಾಕೇಜ್ ಮ್ಯಾನೇಜರ್ ಅನ್ನು ತೆರೆಯುತ್ತೇನೆ (ಗ್ನೋಮ್‌ನಲ್ಲಿ)

    2. ಟೆಸ್ಸೆರಾಕ್ಟ್-ಒಕ್ಆರ್-ಸ್ಪಾ (ಸ್ಪ್ಯಾನಿಷ್ ಭಾಷೆಯಲ್ಲಿ ಸ್ಕ್ಯಾನ್ ಮಾಡಲು) ಮತ್ತು gscan2pdf ಅನ್ನು ಸ್ಥಾಪಿಸಲು ಹುಡುಕಾಟ ಮತ್ತು ಚೌಕಟ್ಟು

    3. ಸ್ಕ್ಯಾನ್ ಮಾಡಲು ನಾನು ಅಪ್ಲಿಕೇಶನ್‌ಗಳು> ಗ್ರಾಫಿಕ್ಸ್> gscan2pdf ಅನ್ನು ತೆರೆಯುತ್ತೇನೆ

    ಮತ್ತು ಸಿದ್ಧವಾಗಿದೆ.

  8.   ಟ್ರೌಬಡೋರ್ ಡಿಜೊ

    ಹೇ ಸ್ನೇಹಿತ, ತುಂಬಾ ಧನ್ಯವಾದಗಳು, ಸತ್ಯವೆಂದರೆ ಟೆಸ್ಸೆರಾಕ್ಟ್ ಉತ್ತಮ ಸಾಧನ, ಆದರೆ "ಸಮಸ್ಯಾತ್ಮಕ" ಸ್ಕ್ಯಾನಿಂಗ್ ಹೊಂದಿರುವ ಪುಸ್ತಕಗಳಿಗೆ ಹೋಲಿಸಿದರೆ ಬಹಳ ಸೀಮಿತವಾಗಿದೆ. ಮತ್ತೊಂದೆಡೆ, ಈ ಸಾಫ್ಟ್‌ವೇರ್ ಹೆಚ್ಚು ಸುಲಭವಾಗಿ ಹೊಂದಿಕೊಳ್ಳುತ್ತದೆ ...

  9.   ಜುವಾನ್ ಆನೆಜ್ ಡಿಜೊ

    ಚಿತ್ರಗಳನ್ನು ಡಿಜಿಟಲೀಕರಣಗೊಳಿಸುವ ಪ್ರಕ್ರಿಯೆಯಲ್ಲಿ, ಪಿಡಿಎಫ್-ಎ ಫೈಲ್‌ಗಳನ್ನು ಪರಿವರ್ತಿಸಲಾಗುತ್ತಿದೆ, ಅವುಗಳನ್ನು ಒಸಿಆರ್ಡ್ ಮಾಡಬೇಕು. ಬ್ಲ್ಯಾಕ್ & ವೈಟ್ ಅಥವಾ ಗ್ರೇಸ್ಕೇಲ್ನಲ್ಲಿ ಸ್ಕ್ಯಾನ್ ಮಾಡುವುದು ಫಲಿತಾಂಶಕ್ಕೆ ಎಷ್ಟು ಸೂಕ್ಷ್ಮವಾಗಿರುತ್ತದೆ? ಏನು ಶಿಫಾರಸು ಮಾಡಲಾಗಿದೆ?