د پی ډي ایف او سي آر کولو څرنګوالی او د متن انتخاب او لټون وړ کړئ

فرض کړئ چې تاسو داسې پی ډی ایف لرئ چې د سکینر په کارولو سره رامینځته شوی ، یا دا چې تاسو ته لیږدول شوی مګر دا د عکس په ب inه معلومات لري. هغه پروسیژر ته چې موږ یې باید خپل محبوب پی ډی ایف وسپارو ، ورته ویل کیږي او.سی.ار: یوه پروسه چې په اوتوماتیک ډول سمبولونه یا کرکټرونه پیژني چې په یو ځانګړي الفبا پورې اړه لري ، د عکس څخه د دې ډاټا په ب storeه کې زیرمه کول چې موږ ورسره د متن ایډیټ کولو برنامه یا ورته ورته معلوماتو له لارې اړیکه نیولی شو.


pdfocr یو ساده وسیله ده چې د سرایت شوي متن پرت سره نوی PDF رامینځته کوي ، کارونکي ته اجازه ورکوي چې متن غوره کړي او په کې د ټکو لټون وکړي ، پرته لدې چې د PDF وروستي ب appearanceه بدله کړي.

هغه څه چې pdfocr د دې لپاره ندي:

دا یوازې کار کوي که چیرې پی ډی ایف د عکس په ب inه معلومات ولري؛ که تاسو د OpenOffice څخه پی ډی ایف صادر کړئ ، دا دمخه د متن دننه پرت ځای لري ، نو دا پروسه غیر ضروري ده.

د پی ډی ایفاکر نصبولو څرنګوالی:

sudo add-apt-repository ppa: gezakovacs / pdfocr
sudo apt-update ترلاسه کول
sudo apt-get pdfocr نصب کړئ

د pdfocr کارولو څرنګوالی:

ټرمینل خلاص کړئ ، لارښود ته لاړ شئ چیرې چې تاسو غواړئ پی ډی ایف تاسو غواړئ پیژندل شوی وي ، او لاندې یې دننه کړئ (د پی ډی ایف سره د انډول. پی ډی ایف ځای په ځای کول چې تاسو غواړئ د نوي فایل نوم سره ځای په ځای کړئ.)

pdfocr -i input.pdf -o output.pdf

ستاسو د PDF هر پا pageې لپاره انتظار وکړئ ترڅو د OCR تمرین شي او د رامینځته کیدو لپاره وروستی تایید شوی فایل. دا باید په هره پا fewه کې څو ثانیې ونیسي ، دا ستاسو د پی ډی اف ریزولوشن پورې اړه لري.


د مقالې مینځپانګه زموږ د اصولو سره سمون لري ایډیټیک اخلاق. د غلطۍ راپور ورکولو لپاره کلیک وکړئ دلته.

9 نظرونه ، خپل پریږدئ

خپله نظر پرېږدئ

ستاسو د بریښنا لیک پته به خپره نه شي. اړین برخو سره په نښه شوي دي *

*

*

  1. د معلوماتو لپاره مسؤل: میګیوانجل ګاتین
  2. د معلوماتو هدف: د سپیم کنټرول ، د نظر مدیریت.
  3. قانونیت: ستاسو رضایت
  4. د معلوماتو راټولول: معلومات به د قانوني مکلفیت پرته دریمې ډلې ته نه لیږدول کیږي.
  5. د معلوماتو ذخیره: ډیټابیس د Occentus شبکې (EU) لخوا کوربه شوی
  6. حقونه: په هر وخت کې تاسو کولی شئ خپل معلومات محدود ، له سره تنظیم او حذف کړئ.

  1.   روډلفو لارا dijo

    روډولوفو @ روډولو - ډیسټاپ: ~ $ sudo apt-get pdfocr انسټال کړئ
    د بنډل لیست لوستل ... وشو
    د انحصاري ونې جوړول
    د حالت معلوماتو لوستل ... وشو
    E: د pdfocr بسته موقعیت نشی موندلی
    روډولفو @ روډولو - ډیسټاپ: ~ $

  2.   راځئ چې لینکس وکاروو dijo

    ایا تاسو باوري کړي چې اړونده PPA اضافه کړئ؟
    دا PPA احتمال لري د اوبنټو زړو نسخو لپاره د pdfocr نسخې ولري. فکر وکړئ چې دا پوسټ دمخه څو میاشتې زوړ دی. په هرصورت ، نظر ورته دی. لانچ پیډ ته لاړ شئ او د PPA په لټه کې شئ چې د میوریک لپاره د pdfocr نسخې لري.
    هڅول! پاول.

  3.   جوور dijo

    ښه ، دا به د دې ازموینې خبره وي ترڅو وګوري چې دا څنګه کار کوي

  4.   راځئ چې لینکس وکاروو dijo

    وړاندې ځه! موږ ته خبر راکړئ که تاسو بریالي یاست !! که دا کار ونکړي موږ کولی شو ستاسو سره د مرستې هڅه هم وکړو! هڅول! پاول.

  5.   ايکس اينکس dijo

    سلام،
    ما برنامې په پی ډي ایف ازمولې او پایله یې ډیره ښه نده. زه د مسلکي اکروباټ 8 ته عادت شوی یم او د ورته ورته شی په لټه کې یم. اکروبیټ فایلونو ته امتیازات د سکین شوي pdfs پاکولو لپاره سیدوي او پدې توګه د ocr لپاره غوره سرچینه ترلاسه کوي. ایا تاسو پوهیږئ که چیرې د دې لپاره حل شتون ولري.

    مننه!

  6.   راځئ چې لینکس وکاروو dijo

    سلام! ما شاوخوا شاوخوا اوریدلي چې ټیسسریکټ غوره د خلاصې سرچینې OCR دی. زه نه پوهیږم چې دا به ښه وي. همچنان ، تاسو باید خپل لاسونه یو څه خندا ترلاسه کړئ ترڅو دا کار وکړي. دلته ځینې لارښوونې دي. که تاسو بریالي یاست ، مهرباني وکړئ ما ته خبر کړئ ځکه چې ، که دا کار وکړي ، نو دا شاید پای کې پای ته ورسیږي.

    لومړی د "http://download.tuxfamily.org/guadausers/guadaV2.03/" څخه Synaptic ، "xsane4tess" په کارولو سره د "ټیسریکټ 2-4" او "عکس اخیستونکي" کڅوړې نصب کړئ.

    بیا په: / کور / yourusername / tmp کې د ټیمپ فولډر جوړ کړئ

    بیا د دې ترتیب کولو لپاره Xsane پرانیزئ ، غوره توبونه> تشکیلات> OCR ټب او لاندې ډک کړئ:

    د OCR قومانده -> xsane2tess -l سپا
    د داخل فایل اختیار -> - i
    د وتلو فایل اختیار -> -o
    د وتلو اختیار --fd انټرنیټ -> -x

    د Xsane تشکیلاتو کې هغه برخې کې چې "خوندي کول" ټب کې دي چیرې چې دا لنډمهاله لارښود وایی ، ډاډ ترلاسه کړئ چې دلته "tmp" فولډر شتون لري چې تاسو یې په "/ home / yourusername" کې رامینځته کړی.

    زه تاسو ته په اوبنټو کې د OCR په اړه د توضیحاتو سره یوه پا aه پریږدم: https://help.ubuntu.com/community/OCR

  7.   راځئ چې لینکس وکاروو dijo

    یو بل میتود چې ما پکې وموندل لاندې دی:

    فرض کول سکینر دمخه د سیسټم لخوا وصل شوی او پیژندل شوی

    1. زه سیسټم> اداره کول> Synaptic کڅوړه مدیر (په جینوم کې)

    2. د ټیسریکټ - اوکرا - سپا نصبولو لپاره چوکاټ او چوکاټ (په هسپانوي کې سکین کولو لپاره) او gscan2pdf

    3. د سکین کولو لپاره زه غوښتنلیکونه> ګرافیک> gscan2pdf خلاصوم

    او چمتو.

  8.   ټروباډور dijo

    سلام ملګري ، ډیره مننه ، حقیقت دا دی چې ټیسریکټ یو ښه وسیله ده ، مګر د "ستونزې" سکینګ سره کتابونو په پرتله خورا محدود دی. له بلې خوا ، دا سافټویر په اسانۍ سره تطابق کوي ... 😀

  9.   ژان انز dijo

    د عکسونو ډیجیټل کولو پروسې کې ، د PDF - A فایلونه بدلیږي ، دا باید OCR شي. په پایله کې څومره حساس دي په تور او سپین یا ګريشک کې سکینګ کول دي؟ څه وړاندیز کیږي؟