પીડીએફનું ઓસીઆર કેવી રીતે કરવું અને ટેક્સ્ટની પસંદગી અને શોધને કેવી રીતે સક્ષમ કરવી

ધારો કે તમારી પાસે પીડીએફ છે જે સ્કેનરની મદદથી બનાવવામાં આવી છે, અથવા તે તમને પસાર કરવામાં આવી છે પરંતુ તેમાં એક છબીના રૂપમાં માહિતી શામેલ છે. આપણે આપણી પ્રિય પીડીએફ સબમિટ કરવાની પ્રક્રિયાને કહેવામાં આવે છે OCR: એક પ્રક્રિયા કે જે આપમેળે ચિહ્નો અથવા અક્ષરો કે જે ચોક્કસ મૂળાક્ષરોને લગતી હોય, તેને ઇમેજમાંથી ડેટાના સ્વરૂપમાં સંગ્રહિત કરે છે કે જેની સાથે આપણે ટેક્સ્ટ સંપાદન પ્રોગ્રામનો ઉપયોગ કરીને અથવા તેના જેવા સંપર્ક કરી શકીએ છીએ.


પીડીએફઓકર એ એક સરળ સાધન છે જે પીડીએફના અંતિમ દેખાવને બદલ્યા વિના, એક એમ્બેડ ટેક્સ્ટ લેયર સાથે નવી પીડીએફ બનાવે છે, વપરાશકર્તાને ટેક્સ્ટ પસંદ કરવા અને તેમાં શબ્દો શોધવાની મંજૂરી આપે છે.

પીડીફોકર શું નથી:

આ ફક્ત ત્યારે જ ઉપયોગી છે જો પીડીએફમાં ઇમેજ ફોર્મમાંની માહિતી હોય; જો તમે ઓપન ffફિસથી પીડીએફ નિકાસ કરો છો, તો તેમાં પહેલાથી જ એમ્બેડ ટેક્સ્ટ સ્તર છે, તેથી આ પ્રક્રિયા બિનજરૂરી છે.

પીડીફોકર કેવી રીતે ઇન્સ્ટોલ કરવું:

sudo -ડ-ptપ્ટ-રીપોઝિટરી પી.પી.એ .: gezakovacs / pdfocr
સુડો apt-get સુધારો
sudo apt-get pdfocr સ્થાપિત કરો

પીડીફોકરનો ઉપયોગ કેવી રીતે કરવો:

ટર્મિનલ ખોલો, ડિરેક્ટરી પર જાઓ જ્યાં તમે કન્વર્ટ કરવા માંગો છો તે પીડીએફ સ્થિત છે, અને નીચેના દાખલ કરો (ઇનપુટ.પીડીએફને બદલીને પીડીએફ બદલો અને નવી ફાઇલના નામ દ્વારા આઉટપુટ.પીડીએફને એમ્બેડ કરેલા ટેક્સ્ટ લેયર સાથે બદલો. )

pdfocr -i input.pdf -o આઉટપુટ.પીડીએફ

તમારી પીડીએફના દરેક પૃષ્ઠની ઓસીઆર પ્રેક્ટિસ થવાની અને અંતિમ ફેરફાર કરેલી ફાઇલ બનાવવાની રાહ જુઓ. આ તમારા પીડીએફના રિઝોલ્યુશનના આધારે પૃષ્ઠ દીઠ થોડી સેકંડ લેશે.


તમારી ટિપ્પણી મૂકો

તમારું ઇમેઇલ સરનામું પ્રકાશિત કરવામાં આવશે નહીં. આવશ્યક ક્ષેત્રો સાથે ચિહ્નિત થયેલ છે *

*

*

  1. ડેટા માટે જવાબદાર: મિગ્યુએલ gelંજેલ ગેટóન
  2. ડેટાનો હેતુ: નિયંત્રણ સ્પામ, ટિપ્પણી સંચાલન.
  3. કાયદો: તમારી સંમતિ
  4. ડેટાની વાતચીત: કાયદાકીય જવાબદારી સિવાય ડેટા તૃતીય પક્ષને આપવામાં આવશે નહીં.
  5. ડેટા સ્ટોરેજ: cસેન્ટસ નેટવર્ક્સ (ઇયુ) દ્વારા હોસ્ટ કરેલો ડેટાબેઝ
  6. અધિકાર: કોઈપણ સમયે તમે તમારી માહિતીને મર્યાદિત, પુન recoverપ્રાપ્ત અને કા deleteી શકો છો.

  1.   રોડોલ્ફો લારા જણાવ્યું હતું કે

    રોડોલ્ફો @ રolfડોલ્ફો-ડેસ્કટ :પ: p $ sud apt-get pdfocr install કરો
    પેકેજ સૂચિ વાંચવી રહ્યું છે ... થઈ ગયું
    અવલંબન વૃક્ષ બનાવવું
    સ્થિતિ માહિતી વાંચવી ... પૂર્ણ થઈ ગયું
    E: pdfocr પેકેજ સ્થિત થઈ શક્યું નથી
    રોડોલ્ફો @ રોડોલ્ફો-ડેસ્કટ$પ: ~ $

  2.   ચાલો લિનક્સ વાપરીએ જણાવ્યું હતું કે

    શું તમે સુસંગત PPA ઉમેરવાનું સુનિશ્ચિત કર્યું છે?
    આ પીપીએમાં જૂની ઉબુન્ટુ સંસ્કરણો માટે પીડીફોકરનાં સંસ્કરણો છે. વિચારો કે આ પોસ્ટ પહેલેથી ઘણા મહિનાઓ જૂની છે. કોઈપણ રીતે, વિચાર સમાન છે. લunchંચપેડ પર જાઓ અને એક પીપીએ જુઓ કે જેમાં મેવરિક માટે પીડીએફકરના સંસ્કરણો છે.
    ચીર્સ! પોલ.

  3.   જાવરે જણાવ્યું હતું કે

    સારું, તે કેવી રીતે કાર્ય કરે છે તે જોવા માટે તેના પરીક્ષણની બાબત હશે

  4.   ચાલો લિનક્સ વાપરીએ જણાવ્યું હતું કે

    આગળ વધો! અમને જણાવો જો તમે સફળ થયા હોત તો !! જો તે કામ ન કરે તો અમે તમને મદદ કરવાનો પણ પ્રયાસ કરી શકીએ છીએ! ચીર્સ! પોલ.

  5.   a01653 જણાવ્યું હતું કે

    હેલો,
    મેં પ્રોગ્રામને પીડીએફ પર ચકાસી લીધો છે અને પરિણામ બહુ સારું નથી. હું વ્યવસાયિક એક્રોબેટ 8 ની આદત છું અને કંઈક આવું જ શોધી રહ્યો હતો. Roક્રોબnedટ સ્કેન કરેલી પીડીએફએસને સાફ અને સીધી કરવા માટે ફાઇલોમાં ઉપયોગિતાઓને પસાર કરે છે અને તેથી ocr માટે વધુ સ્રોત પ્રાપ્ત કરે છે. શું તમે જાણો છો કે આ માટે કોઈ સમાધાન છે કે નહીં.

    શુભેચ્છાઓ

  6.   ચાલો લિનક્સ વાપરીએ જણાવ્યું હતું કે

    નમસ્તે! મેં સાંભળ્યું છે કે ટેસ્સેરેકટ શ્રેષ્ઠ ઓપનસોર્સ ઓસીઆર છે. મને ખબર નથી કે તે સારું રહેશે કે નહીં. ઉપરાંત, તમારે તે કામ કરવા માટે તમારા હાથને થોડો ગંદા બનાવવો પડશે. અહીં કેટલીક સૂચનાઓ આપી છે. જો તમે સફળ છો, તો કૃપા કરીને મને જણાવો, કારણ કે જો તે કાર્ય કરે છે, તો તે કદાચ પોસ્ટ બનશે.

    પહેલા "http://download.tuxfamily.org/guadausers/guadaV2.03/" માંથી સિનેપ્ટીક, "xsane4tess" નો ઉપયોગ કરીને "ટેસેરેક્ટ 2-4" અને "ઇમેજમેકિક" પેકેજો સ્થાપિત કરો.

    પછી આમાં tmp ફોલ્ડર બનાવો: / home / yourusername / tmp

    પછી તેને રૂપરેખાંકિત કરવા માટે Xsane ખોલો, પસંદગીઓ> રૂપરેખાંકન> OCR ટ tabબ અને નીચેના ભરો:

    OCR આદેશ -> xsane2tess -l સ્પા
    ઇનપુટ ફાઇલ વિકલ્પ -> -i
    આઉટપુટ ફાઇલ વિકલ્પ -> -ઓ
    આઉટપુટ વિકલ્પ -ફડી ઇન્ટરફેસ -> -x

    અસ્થાયી ડિરેક્ટરી કહે છે તે ભાગમાં "સેવ" ટ tabબમાં Xsane ગોઠવણીઓમાં, ખાતરી કરો કે ત્યાં "tmp" ફોલ્ડર છે જે તમે "/ home / yourusername" માં બનાવેલ છે

    ઉબુન્ટુમાં ઓસીઆર કેવી રીતે કરવું તેની વિગતો સાથે હું તમને એક પૃષ્ઠ પણ છોડું છું: https://help.ubuntu.com/community/OCR

  7.   ચાલો લિનક્સ વાપરીએ જણાવ્યું હતું કે

    બીજી પદ્ધતિ કે જે મેં એક્સને ત્યાં શોધી કા theી છે:

    ધારી રહ્યા છીએ કે સ્કેનર પહેલાથી જ કનેક્ટ થયેલ છે અને સિસ્ટમ દ્વારા માન્ય છે

    1. હું સિસ્ટમ> એડમિનિસ્ટ્રેશન> સિનેપ્ટિક પેકેજ મેનેજર ખોલો (જીનોમમાં)

    2. હું ટેસેરેક્ટ-ocr-spa (સ્પેનિશમાં સ્કેન કરવા માટે) અને gscan2pdf સ્થાપિત કરવા માટે શોધ અને માળખું

    3. સ્કેન કરવા માટે હું એપ્લિકેશનો> ગ્રાફિક્સ> gscan2pdf ખોલો

    અને તૈયાર છે.

  8.   ટ્રુબાડૌર જણાવ્યું હતું કે

    હે મિત્ર, ખૂબ ખૂબ આભાર, સત્ય એ છે કે પરીક્ષણ એ એક સારું સાધન છે, પરંતુ "સમસ્યારૂપ" સ્કેનિંગવાળી પુસ્તકોની તુલનામાં ખૂબ મર્યાદિત છે. બીજી બાજુ, આ સ softwareફ્ટવેર વધુ સરળતાથી સ્વીકારે છે ... 😀

  9.   જુઆન એનાઝ જણાવ્યું હતું કે

    છબીઓને ડિજિટાઇઝ કરવાની પ્રક્રિયામાં, પીડીએફ-એ ફાઇલો રૂપાંતરિત થઈ રહી છે, આને ઓસીઆર કરવી આવશ્યક છે. બ્લેક એન્ડ વ્હાઇટ અથવા ગ્રેસ્કેલમાં સ્કેનિંગ પરિણામ માટે કેટલું સંવેદનશીલ છે? શું ભલામણ કરવામાં આવે છે?