Salvați paginile web (capturi de ecran ale paginilor web) în PDF cu o singură comandă

Uneori vrem să salvăm ceva de pe un site web în PDF pe computerul nostru, pentru aceasta există instrumentul: wkhtmltopdf

Adică, printr-o comandă putem salva pagina X în .pdf, dar mai întâi să instalăm aplicația:

În Debian, Ubuntu sau derivate, trebuie doar să instalați wkhtmltopdf:

sudo apt-get install wkhtmltopdf

Acesta își va instala dependențele, cum ar fi webkit și unele biblioteci qt, dar acestea sunt biblioteci și nimic ciudat 😉

În alte distribuții îmi imaginez că pachetul trebuie numit la fel.

Odată ce îl avem instalat, utilizarea acestuia este foarte simplă, de exemplu, vom salva www.google.com:

wkhtmltopdf www.google.com google.pdf

Adică, trecem adresa URL a ceea ce dorim să salvăm ca primul parametru, iar numele și .pdf-ul fișierului final pe care îl dorim ca al doilea parametru.

Vă las o captură de ecran a modului în care mi se arată .pdf:

Și iată .pdf:

Descărcați fișierul Google.pdf

Dacă doriți să aflați mai multe opțiuni ale acestei aplicații, fără îndoială ar trebui să citiți ajutorul (om wkhtmltopdf) deoarece lista este oarecum extinsă, include opțiuni pentru utilizarea unui proxy, utilizarea cookie-urilor, antetul personalizat, codificarea site-ului etc.


22 comentarii, lasă-le pe ale tale

Lasă comentariul tău

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *

*

*

  1. Responsabil pentru date: Miguel Ángel Gatón
  2. Scopul datelor: Control SPAM, gestionarea comentariilor.
  3. Legitimare: consimțământul dvs.
  4. Comunicarea datelor: datele nu vor fi comunicate terților decât prin obligație legală.
  5. Stocarea datelor: bază de date găzduită de Occentus Networks (UE)
  6. Drepturi: în orice moment vă puteți limita, recupera și șterge informațiile.

  1.   Juan Ignacio el a spus

    Instrument foarte bun! Mulțumesc de informație!
    Doare numele dificil de reținut ...

    1.    KZKG ^ Gaara el a spus

      Vă mulțumim pentru comentariu 🙂
      Despre nume ... ei bine, putem face întotdeauna un alias 😉 - » https://blog.desdelinux.net/tag/alias/

  2.   FernandoRJ el a spus

    O modalitate ușoară de a obține un site web offline prin printfriendly.com

  3.   dmacias el a spus

    Am folosit pdfmyurl pentru o lungă perioadă de timp, dar l-am încercat și pe arch nu funcționează pentru mine, se preface că îl descarc și apoi nu este acolo. Când am mai mult timp văd că, cu siguranță, îmi lipsește orice bibliotecă sau ceva, deoarece am instalat-o.
    Salutări și treabă bună ce faci 🙂

  4.   krel el a spus

    Gazdă, îmi place postul tău KG ****, dar acesta este un mod minunat de a pierde timpul complicând viața și restul pe care îl pune altcineva ....
    Pe de o parte, există opțiuni precum cea a lui Fernando și vă propun un CleanSave mai bun în Chrome.
    Atunci, mai bine decât toate acestea: Nixnote cu pluginul de browser Clearly al lui Evernote.
    Singurul mod în care văd mai puțin acest lucru este valabil atunci când lucrăm fără interfață, altfel. … .Kk

    1.    KZKG ^ Gaara el a spus

      În cazul în care nu doriți să instalați un plugin în browser sau pur și simplu nu doriți să deschideți browserul, această alternativă este cea mai bună pe care am găsit-o.

      În Linux diversitatea este, fără îndoială, un avantaj, există cei cărora le place să utilizeze suplimente pentru aplicații și altele pur și simplu ca aplicații independente pentru diferite sarcini.

      Mă limitez să împărtășesc toate cunoștințele mele, voi (utilizatorii) alegeți metoda care vă place cel mai mult 😉

      Multumesc pentru comentariul tau.

      1.    krel el a spus

        Tutorialul mi se pare total valabil dar nu știu, în ultima vreme m-am simțit confortabil și ating doar terminalul pentru elementele esențiale. Voi pune, de asemenea, această postare în Nixnote, XD
        Salutări 🙂

        1.    m el a spus

          Dacă trebuie să utilizați acest instrument într-un script sau să automatizați conversiile de pagini web în PDF, puneți Evernote, Chromium și toate accesoriile dvs. acolo unde Soarele nu strălucește niciodată.

          În plus, ce este complicat la asta? La naiba, dar este la fel de ușor ca copierea URI-ului, lipirea acestuia pe linia de comandă (prea la îndemână pentru cei dintre noi care folosim Yakuake) și adăugarea numelui fișierului.

          1.    krel el a spus

            Scuze !!!!!!!!!!! Fiecare arată cel mai simplu, dar vă spun deja, nici măcar ceea ce contați nu este eficient în timp sau resurse. Cu asta vă spun totul, pentru a face ceva care se face cu un clic, aveți nevoie de cel puțin două operații.
            1 Apelați bash
            Comanda a fost așa?
            Dacă vă amintiți, treceți la pasul 3, dar la pasul 2.
            2 Căutați comanda în note (mai mult timp pierdutoooooooooo)
            3 Lansați programul. (AHhhh, tastarea este mai lentă decât clicul)

            În cazul meu, doar un singur clic și am o organizare mai bună, iar când vreau să văd ceva, sincronizez Nixnote. Dar dacă nu vreau Nixnote, CleanSave de la sine este mai bun, de fapt îl pot trimite deja direct la Dropbox și așa mai departe. În plus, în toate cazurile le pot sincroniza pe mai multe computere. etc etc etc

            Apoi, acel script face o replică a paginii, în timp ce cu ceea ce comentez copiați doar ceea ce vă interesează.
            Prin urmare, nu vă mușcați coada. Merg mai departe pentru că aș ajunge să batjocoresc.
            În ceea ce priveşte

          2.    m el a spus

            „Chiar și ceea ce numiți este eficient în timp sau resurse. Cu asta vă spun totul, pentru a face ceva care se face cu un clic, aveți nevoie de cel puțin două operații.
            1 Apelați bash
            Comanda a fost așa?
            Dacă vă amintiți, treceți la pasul 3, dar la pasul 2.
            2 Căutați comanda în note (mai mult timp pierdutoooooooooo)
            3 Lansați programul. (AHhhh, tastarea este mai lentă decât apăsarea »

            Ahhh uite ce am aflat, mulțumesc!
            :p
            Deci tastarea este mai lentă decât utilizarea mouse-ului!? Ar trebui să îi sfătuiți pe inginerii NVidia în timp ce utilizează Emacs și Vim:
            http://www.phoronix.com/scan.php?page=article&item=nvidia_qa_linux&num=1
            (Dar cât de prostii sunt acești tipi, care folosesc Emacs sau Vim pentru mii de linii de cod pe care le scriu, le revizuiesc și le testează pe zi, dacă vor fi inutili ... ah, nu, oprește-te ... sunt ingineri cu Ph. D.! Mmm ... FUCK!)

            Sau poate ai putea explica miilor de administratori de sistem care se ocupă în fiecare zi cu Vim și Emacs de pe o consolă de beneficiile utilizării și abuzului mouse-ului?

            «1 Sunați la bash
            Comanda a fost așa?
            Dacă vă amintiți, treceți la pasul 3, dacă nu pasul 2. »
            Mă trolești, nu? Sau pur și simplu nu ai deschis niciodată o consolă în viața ta?

            «2 Căutați comanda în note (mai mult timp pierdutoooooooooo)»
            Mai trolling?

            «3 Lansați programul. (AHhhh, tastarea este mai lentă decât apăsarea »
            Chiar mai mult troll !!!! ??? Sau pur și simplu nu ai idee despre ce vorbești?

            Așa că nu-ți mușcă coada. Trec mai departe pentru că aș ajunge să-mi bat joc de el ".
            Tocmai ai arătat că nu ai atâta țesătură, calmează-te.

          3.    krel el a spus

            Hahaha, permiteți-mi să vă spun, lucrurile trebuie să se desfășoare cu demnitate, eu sunt total împotrivă: ascultați muzică pe terminal, tweet pe terminal, torrent pe terminal etc. etc. Toate acestea mi se par a fi lucrurile copiilor care nu au alt mod mai util de a pierde timpul.

            În ceea ce privește clicurile pe acest subiect, ați lansat o idiotie pe care nu o credeți. Durează această operațiune și vei vedea că ceea ce spui nu se menține.

            Dar hei, din moment ce nu ai identitate și vezi că Nvidia face un singur lucru și din moment ce acestea sunt ceea ce vrei să fii când vei crește (am vrut să fiu astronaut), vei fi întotdeauna un imitator.

            Terminalul este util, dar nu este un panaceu. De fapt, prefer distribuții precum opensuse, care cu YaST cu greu trebuie să o ating pentru sarcini administrative. Va fi că voi îmbătrâni.

            În caz contrar, clarificați că sunteți un „adept” care încearcă să arate ceea ce nu sunteți și că credeți că folosirea terminalului pentru orice aiurea te face diferit. Ei bine, diferit dacă este, dar în sens negativ. Ahh, știi doar să spui troll, acolo ești încă un adept al doilea.

            Nimic copil, a fost distractiv. Salutari.

      2.    Edward el a spus

        Dacă ești foarte Leneș sau îți place doar să automatizezi lucrurile la maximum, cu siguranță ești dependent de terminal, nu este că este mai mult sau mai puțin complicat, depinde de ceea ce vrei să faci. Dacă doriți și aveți timp, faceți clic dreapta, dacă nu creați un script care caută site-urile care îi interesează pe abonații paginii dvs., convertiți acele site-uri în pdf, le comprimați și le trimiteți prin poștă sau puteți face ce vă puteți imagina doar cu cunoștințele și terminalul.

        Salutări și mulțumiri pentru pont.

    2.    Oțel maxim el a spus

      Ei bine, cred că toate devin mai complicate ... La fel de simplu ca un ctrl + p pentru a tipări și selecta în PDF, și atât ...

      1.    Andres el a spus

        juapushhhh pentru toată lumea de peste 😛

  5.   dragnell el a spus

    Un instrument excelent împreună cu wget m-au ajutat să aduc documentația unor site-uri în pdf. Noroc

  6.   arriaga el a spus

    pe archlinux nu funcționează.
    mai întâi mi-a dat o eroare gnome-keyring, apoi cu sudo nu-mi dă o eroare, dar nu creează pdf-ul.

  7.   Curcubeu_zbură el a spus

    Cineva să mă ajute? xD nu funcționează bine
    rain @ Ubuntu-12: ~ / Desktop $ wkhtmltopdf https://blog.desdelinux.net/guarda-paginas-webs-screenshots-de-webs-en-pdf-con-un-comando/ test.pdf
    Se încarcă pagina (1/2)
    QFont :: setPixel Size: Dimensiune pixel] 88%
    AVERTISMENT: gnome-keyring :: nu s-a putut conecta la: / tmp / keyring-Uz7GwI / pkcs11: Fișierul sau directorul nu există
    Tipărirea paginilor (2/2)
    QFont :: setPixel Size: Dimensiune pixel <= 0 (0)
    Terminat

    Și există un fișier care este imposibil de deschis

  8.   Daniel Rojas el a spus

    Foarte bine atunci când nu avem chef să deschidem browserul 😛

  9.   Rama el a spus

    În debian atât cu iceweasel / firefox, cât și cu crom / crom puteți imprima orice pagină web în pdf. mergi doar la: print, apoi alege opțiunea „print to file” format de ieșire pdf. Interesantul acestei opțiuni este că putem face, de asemenea, anumite configurații ale modului în care pagina va fi tipărită în pdf

    1.    Baronul Ashler el a spus

      Adevărul este că ai dreptate, este disponibil în crom 😀 chiar și așa că voi lua în considerare această postare. Mulțumesc

  10.   Diego el a spus

    Buna ziua.

    CTRL + P nu este mai bun și vi se oferă opțiunea de a imprima într-un fișier, puneți orice nume doriți în document și gata.

  11.   Joan el a spus

    Trebuie să publicați unde găsiți fișierul PDF finalizat pentru a completa articolul dvs. ...