ターミナルを使用する場合：Wgetを使用して完全なWebサイトをダウンロードします

2分

何よりも良い Wikipedia このツールの構成を説明するには：

GNU Wget は、簡単な方法でWebサーバーからコンテンツをダウンロードできる無料のソフトウェアツールです。その名前はWorldWide Web（w）に由来し、「get」（英語ではget）に由来します。つまり、WWWから取得します。

現在、HTTP、HTTPS、およびFTPプロトコルを使用したダウンロードをサポートしています。

それが提供する最も優れた機能の中で wgetの 複雑なミラーを簡単に再帰的にダウンロードしたり、リンクを変換してHTMLコンテンツをローカルに表示したり、プロキシをサポートしたりする可能性があります...

この種の作業を実行するのに役立つ他のアプリケーションがあることは事実です。 httrack またはの拡張機能 Firefoxの として スクラップブック、しかし端末のシンプルさのようなものはありません😀

魔法をかける

私は映画に興味がありました： 社会的ネットワーク、のキャラクターとして マーク・ザッカーバーグ 次のフレーズを使用します。 «ちょっとした魔法のwget«、Facemashの写真をダウンロードしようとしたとき😀そしてそれは本当です、 wgetの 適切なパラメータで魔法をかけることができます。

いくつかの例を見てみましょう。ツールの簡単な使用法から始めましょう。

ページを下に移動するには：

$ wget https://blog.desdelinux.net/con-el-terminal-bajar-un-sitio-web-completo-con-wget

画像やその他の種類のデータを含め、サイト全体を再帰的にダウンロードするには：

$ wget -r https://blog.desdelinux.net/

そして、ここに魔法がやってくる。彼らがの記事で私たちを説明しているように人間、多くのサイトは、さまざまな制限を適用するためにブラウザのIDを確認します。と wget これは次の方法で回避できます。

wget -r -p -U Mozilla https://blog.desdelinux.net/

または、各ページ間で一時停止することもできます。そうしないと、サイトの所有者は、サイトを完全にダウンロードしていることに気付く可能性があります。 wget.

wget --wait=20 --limit-rate=20K -r -p -U Mozilla https://blog.desdelinux.net/

コメントを残す返信をキャンセル

パンデブ92 同
HACE 12年

画像xdのみをダウンロードするものはありますか？

pandev92に返信する
1. 勇気同
  HACE 12年
  
  http://buscon.rae.es/draeI/SrvltConsulta?TIPO_BUS=3&LEMA=vicio
  
  私があなたの心を読んだことははははは
  
  勇気に返信
  1. パンデブ92 同
    HACE 12年
    
    笑ooxd
    
    pandev92に返信する
2. KZKG ^我愛羅同
  HACE 12年
  
  男wget 😉
  
  KZKGに返信^ Gaara
  1. パンデブ92 同
    HACE 12年
    
    人生は人を読むには短すぎる。
    
    pandev92に返信する
    1. KZKG ^我愛羅同
      HACE 12年
      
      人生は短すぎて脳を情報で満たすことができませんが、それでも試してみるのは有効です🙂
      
      KZKGに返信^ Gaara
      1. パンデブ92 同
        HACE 12年
        
        情報は半分の価値があります、私はそれを女性、ゲーム、そして可能であればXDで満たすことを好みます。
        
        pandev92に返信する
      2. 勇気同
        HACE 12年
        
        あなたはいつも女性のことを考えてクソです。これからは、KZKG ^ Gaaraのように、Dadee Yankee、Don Omar、Wisin YYandelを聴きます。
        
        この人生で最も重要なことであるお金にもっと専念する
        
        勇気に返信
        
        KZKG ^我愛羅同
        HACE 12年
        
        お金よりもはるかに価値のあるものがあります...たとえば、歴史の中にいること、違いを生むこと、あなたが世界にどれだけ貢献したかを覚えていること。死んだときにどれだけのお金を持っていたのかではありません😉
        
        成功する人ではなく、勇気ある人、アルバート・アインセインになるようにしてください。
      3. 勇気同
        HACE 12年
        
        そして、橋の下に住む乞食は、ペニーなしでそれを行うことができますか？
        
        うーん、ダメ
        
        勇気に返信
      4. 勇気同
        HACE 12年
        
        *持つため
        
        勇気に返信
      5. パンデブ92 同
        HACE 12年
        
        勇気を出して、私はレガエトンの時代を迎えましたが、もう何年も前のことではありません。私は日本の音楽とクラシック音楽しか聴いていません。お金を使って…私たちはそれに取り組んでいます:)。
        
        pandev92に返信する
      6. パンデブ92 同
        HACE 12年
        
        覚えておいても構わない、ガラ、私が死ぬとき、私は死んで他の人を台無しにするだろう、なぜなら彼らが私のことをどう思っているかさえ知ることができないからだ。覚えておく価値はありますが、xDを誇りに思うことができます。
        
        pandev92に返信する
3. hypersayan_x 同
  HACE 12年
  
  特定の種類のファイルをダウンロードするには、フィルターを使用できます。
  
  https://www.gnu.org/software/wget/manual/html_node/Types-of-Files.html
  
  また、非常に大きなページのクローンを作成する場合は、torなどのプロキシを使用してクローンを作成することをお勧めします。そうしないと、特定のページが特定の数の連続したリクエストに到達し、IPが数時間または数日間ブロックされるためです。。
  ウィキを複製したかったときに私に起こった別の時。
  
  hipersayan_xに返信する
4. mdir 同
  HACE 11年
  
  Firefoxで使用している拡張機能は、画像のみをダウンロードします。「画像を保存0.94」と呼ばれます
  
  Mdirに返信
ブラウン同
HACE 12年

ダウンロードしたファイルはどこに保存されていますか？彼らは私を殺したいと思うでしょう？笑

Pardoに返信する
1. KZKG ^我愛羅同
  HACE 12年
  
  ファイルは、wgetを実行するときに、ターミナルにあるフォルダーにダウンロードされます😉
  
  KZKGに返信^ Gaara
アウロスZx 同
HACE 12年

ああ、wgetがこんなに面白い用途になるとは想像もしていませんでした...さて、Courageが言及している用途に関して...言葉はありません😉

AurosZxに返信する
カルロス-Xfce 同
HACE 12年

Wgetがあなたのブログをダウンロードするのを妨げるWordPressプラグインがあるかどうか誰かが知っていますか？

Carlos-Xfceに返信する
ダージー同
HACE 12年

まあ、それは私にとって素晴らしいです！ありがとうございました

darzeeに返信する
ピオラフスキー同
HACE 12年

とても良いです、貢献に感謝して、どのように見てみましょう。

piolavskiに返信する
ライアーム同
HACE 12年

私は自分自身を初心者だと思っていますが、これは私にとって簡単です。今は他のものと混ぜて、それが何をもたらすかを見ていきます…。

lyairmgに返信する
オズワルド同
HACE 11年

3年2012月XNUMX日（月）ですので、よろしくお願いします

開発するプロジェクトは次のとおりです。

href参照を調整することによるWebサイトの再配置。
1.-Webサイトを検討している場合は、wgetコマンドを使用してサイト全体をローカルディレクトリにダウンロードします。また、作成者のスクリプトを使用して、次の操作を実行します。

1.1.-コンテンツの種類ごとに独立したディレクトリを作成します：gif画像、jpeg画像など、aviビデオ、mpgビデオなど、mp3オーディオ、wavオーディオなど、Webコンテンツ（HTML、javascriptなど）。

1.2.-これらの各コンテンツが再配置されたら、サイト上の各リソースのローカルロケーションへの参照の調整を実行します。

1.3.-Webサーバーをアクティブ化し、Webサイトのバックアップが配置されているルートディレクトリをローカルWebサーバーのルートディレクトリとして構成します。

1.4.-注：wgetコマンドは、次のオプションでのみ使用できます。
–再帰的
–ドメイン
–ページの必要条件
何らかの理由でさらにコマンドが必要な場合は、必要なコマンドを使用してください。

oswaldoに返信する
1. KZKG ^我愛羅同
  HACE 11年
  
  ここにダウンロードするには、投稿に解決策があると思います。ファイルを移動してパスを置き換えるには、しばらく前にこのようなことをしなければなりませんでした。使用したスクリプトはそのままにしておきます。 http://paste.desdelinux.net/4670
  
  ファイルのタイプとパス、つまり、サイトの.HTMLがどのように構成されているかなどを考慮して変更します。
  
  いくつかの調整や変更を行う必要があるため、これは100％の解決策ではありませんが、すべての作業の70％または80％であることを保証します😉
  
  KZKGに返信^ Gaara
  1. オズワルド同
    HACE 11年
    
    ありがとうKZKG ^ Gaaraは私にとって大きな助けになりました
    
    oswaldoに返信する
デブド同
HACE 11年

私はいつもhttrackを使ってきました。 firefoxのスクラップブック試してみるつもりですが、wgetが大好きです。ありがとうございました！

Debdに返信する
ダニエルPZ 同
HACE 11年

男、コマンドは私のために機能しませんでした...これは私のためにうまく機能しました：

wget –random-wait -r -p -e robots = off -U mozilla http://www.example.com

ダニエルPZに返信
1. Daniel Mölk 同
  HACE 9年
  
  どうもありがとう！ Daniel PZが提案したパラメーターで使用しましたが、問題はありませんでした🙂
  
  ダニエルに返信
ルーベン・アルマゲール同
HACE 11年

ありがとう、私はLinuxの子犬のWGetでそれをしましたが、ターミナルでそれを行う方法がわかりませんでした。挨拶

RubénAlmaguerへの返信
ピストンド同
HACE 10年

ページはどこに保管しますか？

ピストンドに返信
1. 斧同
  HACE 10年
  
  ターミナルを開いている場所。別のパスを指定しない限り、最初はユーザールートフォルダーにあります。
  
  Hacheに返信する
フェルナンド同
HACE 10年

リンクもダウンロードしますか？それで、pdfまたは別のドキュメントへのリンクがある場合、それもダウンロードしますか？

フェルナンドに返信
川同
HACE 9年

ブログ全体をダウンロードするにはどうすればよいですか。試してみましたが、ダウンロードに何時間もかかったにもかかわらず、コードに表示されたりブロックされたりしているようですが、最初のページしか読み取れません。ダウンロードすることをお勧めします。私のブログ、ありがとうラウル。

ラウルに返信
レオ同
HACE 9年

こんにちは、html内のリンクを置き換えて、後でダウンロードしたページを元のページであるかのように閲覧できるようにすることが可能かどうかは疑問です。

ページをダウンロードし、ダウンロードしたファイルからページを開いたときに、.cssまたは.jsを取得しなかったため、ページ上のリンクからインターネット上のページに移動しました。

レオに返信

魔法をかける

コメントを残す 返信をキャンセル

コメントを残す返信をキャンセル