Сохранение веб-страниц (скриншотов веб-сайтов) в PDF с помощью одной команды

Иногда мы хотим сохранить что-то с веб-сайта в формате PDF на нашем ПК, для этого есть инструмент: wkhtmltopdf

То есть с помощью команды мы можем сохранить X-страницу в .pdf, но сначала давайте установим приложение:

В Debian, Ubuntu или производных просто установите wkhtmltopdf:

sudo apt-get install wkhtmltopdf

Он установит свои зависимости, такие как webkit и некоторые библиотеки qt, но это библиотеки и ничего странного 😉

Я полагаю, что в других дистрибутивах пакет должен называться так же.

После того, как мы его установили, пользоваться им стало очень просто, например, мы собираемся сохранить www.google.com:

wkhtmltopdf www.google.com google.pdf

То есть мы передаем URL-адрес того, что мы хотим сохранить, в качестве первого параметра, а имя и .pdf окончательного файла, который мы хотим, в качестве второго параметра.

Вот скриншот того, как мне показывают .pdf:

А вот .pdf:

Скачать файл Google.pdf

Если вы хотите узнать больше о возможностях этого приложения, без сомнения, вам следует прочитать справку (человек wkhtmltopdf), поскольку список довольно обширен, он включает варианты использования прокси, файлов cookie, настраиваемого заголовка, кодировки сайта и т. д.


22 комментариев, оставьте свой

Оставьте свой комментарий

Ваш электронный адрес не будет опубликован. Обязательные для заполнения поля помечены *

*

*

  1. Ответственный за данные: Мигель Анхель Гатон
  2. Назначение данных: контроль спама, управление комментариями.
  3. Легитимация: ваше согласие
  4. Передача данных: данные не будут переданы третьим лицам, кроме как по закону.
  5. Хранение данных: база данных, размещенная в Occentus Networks (ЕС)
  6. Права: в любое время вы можете ограничить, восстановить и удалить свою информацию.

  1.   Хуан Игнасио сказал

    Очень хороший инструмент! Спасибо за информацию!
    Больно имя сложно вспомнить че ...

    1.    КЗКГ ^ Гаара сказал

      Спасибо за комментарий 🙂
      Насчет названия ... ну, мы всегда можем придумать псевдоним 😉 - » https://blog.desdelinux.net/tag/alias/

  2.   ФернандоРЖ сказал

    Простой способ получить офлайн-сайт через printfriendly.com

  3.   дмасиас сказал

    Я долгое время использовал pdfmyurl, но я пробовал этот, и на Arch он у меня не работает, он делает вид, что загружает его, а затем его нет. Когда у меня появляется больше времени, я вижу, что мне наверняка не хватает какой-либо библиотеки или чего-то еще, так как она только что установлена.
    Привет и отличной работы, чем занимаешься 🙂

  4.   Крель сказал

    Ведущий, мне нравится ваш пост KG **** но это отличный способ тратить время, усложняя жизнь, а остальное, что кто-то ставит….
    С одной стороны, есть такие варианты, как у Фернандо, и я предлагаю лучшее CleanSave в Chrome.
    Тогда лучше, чем все это: Nixnote с плагином Evernote Clearly для браузера.
    Единственный способ, которым я вижу больше меньше, это справедливо, когда мы работаем без интерфейса, иначе. … .Kk

    1.    КЗКГ ^ Гаара сказал

      Если вы не хотите устанавливать плагин в браузере или просто не хотите открывать браузер, эта альтернатива - лучшее, что я нашел.

      В Linux разнообразие, несомненно, преимущество, есть те, кто любит использовать надстройки для приложений, а другие просто любят независимые приложения для разных задач.

      Я ограничиваюсь тем, что делюсь всеми своими знаниями, вы (пользователи) выбираете тот метод, который вам больше всего нравится 😉

      Спасибо за ваш комментарий.

      1.    Крель сказал

        Учебник кажется мне полностью действующим, но я не знаю, в последнее время мне стало комфортно, и я касаюсь терминала только для самого необходимого. Я также собираюсь поместить этот пост в свой Nixnote, XD
        Привет 🙂

        1.    m сказал

          Если вам нужно использовать этот инструмент в скрипте или автоматизировать преобразование веб-страниц в PDF, вы поместите Evernote, Chromium и всю свою атрибутику туда, где никогда не светит солнце.

          Кроме того, что в этом сложного? Черт, но это так же просто, как скопировать URI, вставить его в командную строку (слишком удобно для тех из нас, кто использует Yakuake) и добавить имя файла.

          1.    Крель сказал

            К сожалению !!!!!!!!!!! Каждый ищет самое простое, но я уже говорю вам, что даже то, что вы считаете, не эффективно с точки зрения времени или ресурсов. На этом я вам все скажу, чтобы сделать что-то, что делается одним щелчком мыши, вам нужно как минимум две операции.
            1 Вызов bash
            Команда такая?
            Если помните, переходите к шагу 3, если не к шагу 2.
            2 Ищи команду в заметках (еще раз потерялоооооооооо)
            3 Запустите программу. (Аааа, печатать медленнее, чем нажимать)

            В моем случае всего один щелчок, и у меня есть лучшая организация, и когда я хочу что-то увидеть, я синхронизирую Nixnote. Но если мне не нужен Nixnote, лучше использовать CleanSave, на самом деле я уже могу отправить его напрямую в Dropbox и т. Д. Кроме того, во всех случаях я могу синхронизировать их на нескольких компьютерах. и т.д. и т.п.

            Затем этот сценарий создает копию страницы, а то, что я комментирую, вы копируете только то, что вас интересует.
            Поэтому не кусайте хвост. Я иду дальше, потому что в конечном итоге буду смеяться над этим.
            привет

          2.    m сказал

            «Даже то, что вы считаете, эффективно по времени или ресурсам. На этом я вам все рассказываю, чтобы сделать что-то, что делается одним щелчком мыши, вам потребуется как минимум две операции.
            1 Вызов bash
            Команда такая?
            Если помните, переходите к шагу 3, если не к шагу 2.
            2 Ищи команду в заметках (еще раз потерялоооооооооо)
            3 Запустите программу. (Аааа, печатать медленнее, чем нажимать »

            Ах, посмотрите, что я пришел узнать, спасибо!
            :p
            Так что печатать медленнее, чем с помощью мыши !? Вы должны посоветовать инженерам NVidia, как они используют Emacs и Vim:
            http://www.phoronix.com/scan.php?page=article&item=nvidia_qa_linux&num=1
            (Но как же глупо эти ребята, использующие Emacs или Vim для тысяч строк кода, которые они пишут, просматривают и тестируют в день, если они будут бесполезны ... ах, нет, стоп ... они инженеры с докторской степенью! Ммм ... ЧЕРТ, !)

            Или, может быть, вы могли бы объяснить тысячам системных администраторов, которые ежедневно работают с Vim и Emacs с консоли, преимущества использования мыши и злоупотребления ею?

            «1 Call Bash
            Команда такая?
            Если помните, переходите к шагу 3, если не к шагу 2. »
            Ты меня троллишь, да? Или вы просто никогда в жизни не открывали консоль?

            «2 Ищи команду в заметках (еще раз потерялоооооооооо)»
            Еще троллинг?

            «3 Запустите программу. (Аааа, печатать медленнее, чем нажимать »
            Еще больше троллинга !!!! ??? Или вы просто не понимаете, о чем говорите?

            Так что не кусай свой хвост. Я иду дальше, потому что в конечном итоге буду смеяться над этим ».
            Вы только что доказали, что у вас не так много ткани, успокойтесь.

          3.    Крель сказал

            Хахаха, позвольте мне сказать вам, что все должно выполняться с достоинством, я категорически против: слушать музыку на терминале, твитнуть на терминале, торрент на терминале и т. Д. И т. Д. Все это, как мне кажется, принадлежит детям, у которых нет другого более полезного способа тратить время.

            Что касается кликов по этой теме, вы выпустили идиотизм, что не верите. Проведите эту операцию, и вы увидите, что то, что вы говорите, не выполняется.

            Но послушайте, поскольку у вас нет личности и вы видите, что Nvidia делает одно, и поскольку они - то, кем вы хотите быть, когда вырастете (я хотел быть космонавтом), вы всегда будете подражателем.

            Терминал полезен, но не панацея. На самом деле я предпочитаю такие дистрибутивы, как opensuse, которые с YaST мне почти не нужно трогать для административных задач. Будет так, что я уже стану старше.

            В противном случае вы просто даете понять, что вы «последователь», который пытается показать, чем вы не являетесь, и что вы думаете, что использование терминала для любой ерунды отличает вас. Ну, иначе, если это так, но в отрицательном смысле. Ах, ты только умеешь сказать тролль, вот ты еще второсортный последователь.

            Ничего, малыш, это было весело. С уважением.

      2.    Эддуардо сказал

        Если вы очень ленивы или просто любите автоматизировать вещи по максимуму, вы наверняка зависимы от терминала, дело не в том, что он более или менее сложен, это зависит от того, что вы хотите делать. Если вы хотите и у вас есть время, вы можете щелкнуть правой кнопкой мыши, если нет, вы создаете скрипт, который ищет веб-сайты, которые интересуют подписчиков вашей страницы, конвертирует эти веб-сайты в pdf, сжимает их и отправляет их по почте, или вы можете делать то, что можете только представьте со знанием и терминалом.

        Приветствую и спасибо за подсказку.

    2.    Макс Сталь сказал

      Ну, я думаю, все они становятся сложнее ... Так же просто, как ctrl + p для печати и выбора в PDF, и все ...

      1.    Андрес сказал

        juapushhhh для всех выше above

  5.   Драгнелл сказал

    Отличный инструмент вместе с wget помог мне перенести документацию некоторых сайтов в pdf. Ура

  6.   Арриага сказал

    в Archlinux это не работает.
    сначала он дал мне ошибку gnome-keyring, затем с sudo он не выдает мне ошибки, но не создает pdf.

  7.   Радужная муха сказал

    Кто-нибудь Помогите мне? xD плохо работает
    дождь @ Ubuntu-12: ~ / Рабочий стол $ wkhtmltopdf https://blog.desdelinux.net/guarda-paginas-webs-screenshots-de-webs-en-pdf-con-un-comando/ test.pdf
    Страница загрузки (1/2)
    QFont :: setPixelSize: Размер пикселя] 88%
    ВНИМАНИЕ: gnome-keyring :: не удалось подключиться к: / tmp / keyring-Uz7GwI / pkcs11: файл или каталог не существует
    Печать страниц (2/2)
    QFont :: setPixelSize: Размер пикселя <= 0 (0)
    Готово

    И есть файл, который невозможно открыть

  8.   Даниэль Рохас сказал

    Очень хорошо, когда нам не хочется открывать браузер 😛

  9.   Рама сказал

    В Debian как с iceweasel / firefox, так и с хромом / хромом вы можете распечатать любую веб-страницу в формате pdf. просто зайдите в: печать, затем выберите опцию «печать в файл» в формате вывода pdf. Интересная особенность этой опции заключается в том, что мы также можем настроить определенные конфигурации того, как страница будет печататься в формате pdf.

    1.    Барон Эшлер сказал

      Правда в том, что вы правы, он доступен в хроме 😀 даже в этом случае я рассмотрю этот пост. Спасибо

  10.   Диего сказал

    Эй.

    CTRL + P не лучше, и вам предоставляется возможность распечатать в файл, вы называете документ, который хотите, и все.

  11.   Джоан сказал

    Вам нужно опубликовать, где найти готовый PDF-файл, чтобы завершить свою статью ...