Salve páginas da web (capturas de tela da web) em PDF com um comando

Às vezes queremos salvar algo de um site em PDF no nosso PC, para isso existe a ferramenta: wkhtmltopdf

Ou seja, por meio de um comando podemos salvar a página X em .pdf, mas primeiro vamos instalar o aplicativo:

No Debian, Ubuntu ou derivados, basta instalar wkhtmltopdf:

sudo apt-get install wkhtmltopdf

Ele irá instalar suas dependências como webkit e algumas bibliotecas qt, mas são bibliotecas e nada de estranho 😉

Em outras distros, imagino que o pacote deva ter o mesmo nome.

Depois de instalado, é muito simples de usar, por exemplo vamos salvar www.google.com:

wkhtmltopdf www.google.com google.pdf

Ou seja, passamos a URL do que queremos salvar como o primeiro parâmetro, e o nome e .pdf do arquivo final que queremos como o segundo parâmetro.

Deixo uma captura de tela de como o .pdf é mostrado para mim:

E aqui está o .pdf:

Baixe o arquivo Google.pdf

Se você deseja conhecer mais opções deste aplicativo, sem dúvida você deve ler a ajuda (homem wkhtmltopdf) uma vez que a lista é um tanto extensa, inclui opções para usar um proxy, usar cookies, cabeçalho personalizado, codificação de site, etc.


22 comentários, deixe o seu

Deixe um comentário

Seu endereço de email não será publicado. Campos obrigatórios são marcados com *

*

*

  1. Responsável pelos dados: Miguel Ángel Gatón
  2. Finalidade dos dados: Controle de SPAM, gerenciamento de comentários.
  3. Legitimação: Seu consentimento
  4. Comunicação de dados: Os dados não serão comunicados a terceiros, exceto por obrigação legal.
  5. Armazenamento de dados: banco de dados hospedado pela Occentus Networks (UE)
  6. Direitos: A qualquer momento você pode limitar, recuperar e excluir suas informações.

  1.   Juan Ignacio dito

    Muito boa ferramenta! Obrigado pela dica!
    Dói o nome difícil de lembrar che ...

    1.    KZKG ^ Gaara dito

      Obrigado pelo seu comentário 🙂
      Sobre o nome ... bem, podemos sempre fazer um alias 😉 - » https://blog.desdelinux.net/tag/alias/

  2.   FernandoRJ dito

    Uma maneira fácil de obter um site offline em printfriendly.com

  3.   dmacias dito

    Usei o pdfmyurl há muito tempo, mas experimentei este e no arch não funciona comigo, finge fazer o download e depois não está lá. Quando tenho mais tempo, vejo que certamente estou perdendo alguma biblioteca ou algo assim, pois acabei de instalá-la.
    Saudações e bom trabalho, o que você faz 🙂

  4.   krel dito

    Anfitrião, gostei do seu post KG **** mas essa é uma ótima maneira de perder tempo complicando a vida e o resto que outra pessoa coloca….
    Por um lado, existem opções como a de Fernando e eu proponho um CleanSave melhor no Chrome.
    Então, melhor do que tudo isso: Nixnote com o plugin de navegador Clearly do Evernote.
    A única maneira de ver mais menos isso é válido quando estamos trabalhando sem uma interface, caso contrário. … .Kk

    1.    KZKG ^ Gaara dito

      Caso você não queira instalar um plugin no navegador, ou simplesmente não queira abrir o navegador, esta alternativa é a melhor que encontrei.

      No Linux, a diversidade é sem dúvida uma vantagem, há quem goste de usar addons para aplicações e outros simplesmente como aplicativos independentes para diferentes tarefas.

      Limito-me a partilhar todo o meu conhecimento, vocês (utilizadores) escolhem o método que mais gostam 😉

      Obrigado pelo seu comentário.

      1.    krel dito

        O tutorial me parece totalmente válido, mas não sei, ultimamente fiquei confortável e só toco no terminal para o essencial. Também vou colocar este post no meu Nixnote, XD
        Saudações 🙂

        1.    m dito

          Se você precisar usar esta ferramenta em um script ou automatizar as conversões de páginas da web para PDF, coloque Evernote, Chromium e toda a sua parafernália onde o Sol nunca brilha.

          Além disso, o que há de complicado nisso? Droga, mas é tão fácil quanto copiar o URI, colá-lo na linha de comando (muito útil para aqueles de nós que usam Yakuake) e adicionar o nome do arquivo.

          1.    krel dito

            Desculpa !!!!!!!!!!! Cada um procura o mais simples, mas eu já te digo, nem o que você conta é eficiente em tempo ou recursos. Com isso te conto tudo, para fazer algo que se faz com um clique são necessárias pelo menos duas operações.
            1 Call bash
            O comando é assim?
            Se você se lembrar, vá para a etapa 3, mas etapa 2.
            2 Procure o comando nas notas (mais tempo lostoooooooooo)
            3 Inicie o programa. (AHhhh, digitar é mais lento do que clicar)

            No meu caso, basta um clique e tenho uma organização melhor, e quando quero ver algo sincronizo o Nixnote. Mas se não quero o Nixnote, CleanSave por si só é melhor, na verdade já posso enviar diretamente para o Dropbox, etc. Além disso, em todos os casos posso sincronizá-los em vários computadores. etc etc etc

            Então, esse script faz uma réplica da página, enquanto com o que comento você apenas copia o que lhe interessa.
            Portanto, não morda o rabo. Eu sigo em frente porque acabaria zombando de mim.
            lembranças

          2.    m dito

            “Até o que você conta é eficiente em tempo ou recursos. Com isso te conto tudo, para fazer algo que se faz com um clique são necessárias pelo menos duas operações.
            1 Call bash
            O comando é assim?
            Se você se lembrar, vá para a etapa 3, mas etapa 2.
            2 Procure o comando nas notas (mais tempo lostoooooooooo)
            3 Inicie o programa. (AHhhh, digitar é mais lento do que clicar »

            Ahhh olha o que eu vim descobrir, obrigado!
            :p
            Então digitar é mais lento do que usar o mouse! Você deve aconselhar os engenheiros da NVidia como eles usam o Emacs e o Vim:
            http://www.phoronix.com/scan.php?page=article&item=nvidia_qa_linux&num=1
            (Mas que bobos são esses caras, usando Emacs ou Vim para as milhares de linhas de código que escrevem, revisam e testam por dia, se forem inúteis ... ah, não, pare ... eles são engenheiros com Ph. D.! Mmm ... FUCK !)

            Ou talvez você pudesse explicar aos milhares de administradores de sistema que lidam com o Vim e o Emacs todos os dias a partir de um console os benefícios de usar e abusar do mouse?

            «1 Call bash
            O comando é assim?
            Se você se lembrar, vá para a etapa 3, se não para a etapa 2. »
            Você está me trollando, certo? Ou você simplesmente nunca abriu um console na sua vida?

            «2 Procure o comando nas notas (mais tempo lostoooooooooo)»
            Mais trolling?

            «3 Inicie o programa. (AHhhh, digitar é mais lento do que clicar »
            Ainda mais trolling !!!! ??? Ou você simplesmente não tem ideia do que está falando?

            Portanto, não morda o rabo. Eu sigo em frente porque eu iria acabar tirando sarro disso. "
            Você acabou de provar que não tem tanto tecido, acalme-se.

          3.    krel dito

            Hahaha, deixa eu te dizer, você tem que saber carregar as coisas com dignidade, eu me oponho totalmente a: ouvir música no terminal, tweetar no terminal, torrent no terminal, etc. etc. Tudo isso me parece coisa de crianças que não têm outra maneira mais útil de perder tempo.

            Quanto aos cliques neste tópico, você lançou uma idiotice que você não acredita. Cronometre esta operação e você verá que o que você diz não se sustenta.

            Mas hey, como você não tem identidade e vê que a Nvidia faz uma coisa, e como eles são o que você quer ser quando crescer (eu queria ser astronauta), você sempre será um imitador.

            O terminal é útil, mas não é uma panacéia. Na verdade, eu prefiro distros como o opensuse, que com o YaST dificilmente preciso tocá-lo para tarefas administrativas. Será que já vou envelhecendo.

            Do contrário, você apenas deixa claro que é um "seguidor" que tenta mostrar o que você não é e que acha que usar o terminal para qualquer bobagem o torna diferente. Bem, diferente se isso acontecer, mas em um sentido negativo. Ahh, você só sabe dizer troll, aí você ainda é um seguidor de segunda categoria.

            Nada garoto, isso foi divertido. Saudações.

      2.    Eduardo dito

        Se és muito Preguiçoso ou apenas gostas de automatizar ao máximo, com certeza és viciado em terminal, não que seja mais ou menos complicado, depende do que queres fazer. Se você quiser e tiver tempo, pode clicar com o botão direito do mouse, senão fazer um script que procura os sites que interessam aos assinantes de sua página, converte esses sites em pdf, compacta-os e envia por e-mail ou você pode fazer o que puder imagine só com o conhecimento e o terminal.

        Saudações e obrigado pela dica.

    2.    Max Aço dito

      Bem, acho que todos ficam mais complicados ... Tão simples quanto ctrl + p para imprimir e selecionar em PDF, e é isso ...

      1.    Andres dito

        juapushhhh para todos acima 😛

  5.   dragnell dito

    Excelente ferramenta junto com o wget me ajudou a trazer a documentação de alguns sites para pdf. Felicidades

  6.   Arriaga dito

    no archlinux não funciona.
    primeiro ele me deu um erro do chaveiro do gnome, em seguida, com o sudo, ele não me deu um erro, mas não cria o pdf.

  7.   rainbow_fly dito

    Alguem me ajuda? xD não funciona bem
    rain @ Ubuntu-12: ~ / Desktop $ wkhtmltopdf https://blog.desdelinux.net/guarda-paginas-webs-screenshots-de-webs-en-pdf-con-un-comando/ test.pdf
    Carregando página (1/2)
    QFont :: setPixelSize: tamanho do pixel] 88%
    AVISO: gnome-keyring :: não foi possível conectar a: / tmp / keyring-Uz7GwI / pkcs11: Arquivo ou diretório não existe
    Imprimindo páginas (2/2)
    QFont :: setPixelSize: Tamanho do pixel <= 0 (0)
    Pronto

    E há um arquivo que é impossível abrir

  8.   Daniel Rojas dito

    Muito bom para quando não temos vontade de abrir o navegador 😛

  9.   rama dito

    no debian tanto com iceweasel / firefox quanto com cromo / cromo você pode imprimir qualquer página da web em pdf. basta acessar: imprimir e escolher a opção "imprimir para arquivo" formato de saída pdf. O interessante desta opção é que também podemos fazer certas configurações de como a página será impressa em pdf

    1.    Barão Ashler dito

      A verdade é que tem razão, está disponível em cromo 😀 mesmo assim considerarei este post. Obrigado

  10.   Diego dito

    Olá.

    CTRL + P não é melhor, e você tem a opção de imprimir em um arquivo, você nomeia o documento que deseja e pronto.

  11.   Joan dito

    Você precisa publicar onde encontrar o PDF concluído para finalizar seu artigo ...