टर्मिनल के साथ: Wget के साथ एक पूरी वेबसाइट डाउनलोड करें

इससे बेहतर कुछ भी नहीं विकिपीडिया यह समझाने के लिए कि इस उपकरण में क्या है:

जीएनयू Wget एक मुफ्त सॉफ्टवेयर टूल है जो वेब सर्वर से सामग्री को सरल तरीके से डाउनलोड करने की अनुमति देता है। इसका नाम वर्ल्ड वाइड वेब (डब्ल्यू), और "गेट" (अंग्रेजी में मिलता है) से निकला है, इसका मतलब है: डब्ल्यूडब्ल्यूडब्ल्यू से प्राप्त करें।

वर्तमान में यह HTTP, HTTPS और FTP प्रोटोकॉल का उपयोग कर डाउनलोड का समर्थन करता है।

सबसे उत्कृष्ट सुविधाओं में यह प्रदान करता है wget जटिल दर्पणों के पुन: डाउनलोड करने की संभावना है, स्थानीय स्तर पर HTML सामग्री प्रदर्शित करने के लिए लिंक का रूपांतरण, प्रॉक्सी के लिए समर्थन ...

यह सच है कि ऐसे अन्य अनुप्रयोग हैं जो हमें इस प्रकार के कार्य करने में मदद करते हैं जैसे कि दरार या एक्सटेंशन भी Firefox जैसा स्क्रैपबुक, लेकिन एक टर्मिनल की सादगी की तरह कुछ भी नहीं simpl

जादू कर रहा है

मैं फिल्म को लेकर उत्सुक था: सामाजिक नेटवर्क, के चरित्र के रूप में मार्क जकरबर्ग वाक्यांश का उपयोग करें: «जादू की एक बिट«, जब मैं फेसमाश about के लिए फोटो डाउनलोड करने वाला था और यह सच है, wget आपको उचित मापदंडों के साथ जादू करने की अनुमति देता है।

आइए उदाहरणों के एक जोड़े को देखें, चलो उपकरण के सरल उपयोग से शुरू करें।

एक पृष्ठ नीचे जाने के लिए:

$ wget https://blog.desdelinux.net/con-el-terminal-bajar-un-sitio-web-completo-con-wget

छवियों और अन्य प्रकार के डेटा सहित, पूरी साइट को पुन: डाउनलोड करने के लिए:

$ wget -r https://blog.desdelinux.net/

और यहाँ जादू आता है। जैसा कि वे हमें के लेख में समझाते हैं इंसानों, कई साइटें विभिन्न प्रतिबंधों को लागू करने के लिए ब्राउज़र की पहचान को सत्यापित करती हैं। साथ में wget हम निम्नलिखित तरीके से इसे दरकिनार कर सकते हैं:

wget  -r -p -U Mozilla https://blog.desdelinux.net/

या हम प्रत्येक पृष्ठ के बीच विराम दे सकते हैं, क्योंकि अन्यथा साइट के मालिक को एहसास हो सकता है कि हम साइट को पूरी तरह से डाउनलोड कर रहे हैं wget.

wget --wait=20 --limit-rate=20K -r -p -U Mozilla https://blog.desdelinux.net/


अपनी टिप्पणी दर्ज करें

आपका ईमेल पता प्रकाशित नहीं किया जाएगा। आवश्यक फ़ील्ड के साथ चिह्नित कर रहे हैं *

*

*

  1. डेटा के लिए जिम्मेदार: मिगुएल elngel Gatón
  2. डेटा का उद्देश्य: नियंत्रण स्पैम, टिप्पणी प्रबंधन।
  3. वैधता: आपकी सहमति
  4. डेटा का संचार: डेटा को कानूनी बाध्यता को छोड़कर तीसरे पक्ष को संचार नहीं किया जाएगा।
  5. डेटा संग्रहण: ऑकेंटस नेटवर्क्स (EU) द्वारा होस्ट किया गया डेटाबेस
  6. अधिकार: किसी भी समय आप अपनी जानकारी को सीमित, पुनर्प्राप्त और हटा सकते हैं।

  1.   पांडव92 कहा

    केवल छवियों को डाउनलोड करने के लिए कुछ है xd?

    1.    साहस कहा

      http://buscon.rae.es/draeI/SrvltConsulta?TIPO_BUS=3&LEMA=vicio

      कि मैंने अभी तुम्हारे मन को हाहाहा पढ़ा

      1.    पांडव92 कहा

        lol oo xd

    2.    KZKG ^ गारा कहा

      आदमी भूल जाता है ????

      1.    पांडव92 कहा

        मनुष्य को पढ़ने के लिए जीवन बहुत छोटा है।

        1.    KZKG ^ गारा कहा

          मस्तिष्क को जानकारी से भरने के लिए जीवन बहुत छोटा है, लेकिन यह अभी भी 🙂 की कोशिश करने के लिए वैध है

          1.    पांडव92 कहा

            जानकारी का मूल्य आधा है, मैं इसे महिलाओं, गेम और पैसे से भरना पसंद करता हूं यदि संभव हो तो एक्सडी।

          2.    साहस कहा

            आप हमेशा महिलाओं के बारे में सोचकर चुदाई करते हैं। अब से आप DZe यांकी, डॉन उमर और Wisin Y Yandel जैसे KZKG ^ Gaara करते हैं।

            अपने आप को पैसे के लिए बेहतर समर्पित करें, जो इस जीवन में सबसे महत्वपूर्ण बात है

            1.    KZKG ^ गारा कहा

              ऐसी चीजें हैं जो पैसे से बहुत अधिक मूल्य की हैं ... उदाहरण के लिए, इतिहास में होने के नाते, एक फर्क पड़ता है, इस बात के लिए याद किया जाता है कि आपने दुनिया में कितना योगदान दिया; और आपके लिए कितना पैसा नहीं था जब आप मर गए money

              सफलता का आदमी नहीं बल्कि साहस का आदमी बनने की कोशिश करें, अल्बर्ट आइंस्टीन।


          3.    साहस कहा

            और क्या एक पुल के नीचे रहने वाला भिखारी एक पैसा लिए बिना ऐसा कर सकता है?

            नहीं

          4.    साहस कहा

            *रखने के लिए

          5.    पांडव92 कहा

            साहस, मैं अपने रेगेटन युग और अब ठीक नहीं था, जो कि वर्षों पहले था, मैं केवल जापानी संगीत और शास्त्रीय संगीत सुनता हूं, और पैसे के साथ ... हम इस पर काम कर रहे हैं :)

          6.    पांडव92 कहा

            मुझे याद रखने की परवाह नहीं है, गारा, जब मैं मर जाऊंगा तो मैं मर गया होगा और दूसरों को डराऊंगा, क्योंकि मैं यह भी नहीं जान पाऊंगा कि वे मेरे बारे में क्या सोचते हैं। याद रखने लायक क्या है लेकिन आप इस पर गर्व कर सकते हैं xD

    3.    hypersayan_x कहा

      एक विशिष्ट प्रकार की फ़ाइलों को डाउनलोड करने के लिए आप फ़िल्टर का उपयोग कर सकते हैं:

      https://www.gnu.org/software/wget/manual/html_node/Types-of-Files.html

      और एक टिप, यदि आप एक बहुत बड़े पृष्ठ को क्लोन करने जा रहे हैं, तो यह अनुशंसा की जाती है कि आप इसे प्रॉक्सी के माध्यम से करें जैसे कि टोर, क्योंकि अन्यथा कुछ निश्चित पृष्ठ हैं जो निश्चित संख्या में लगातार अनुरोधों तक पहुंच गए हैं, आपके आईपी को कई घंटों या दिनों के लिए अवरुद्ध कर रहे हैं। ।
      दूसरी बार जो मेरे साथ हुआ जब मैं एक विकी का क्लोन बनाना चाहता था।

    4.    मुदिर कहा

      एक एक्सटेंशन, जो मैं फ़ायरफ़ॉक्स में उपयोग करता हूं, केवल छवियों को डाउनलोड करता है; इसे "सेव इमेजेज 0.94" कहा जाता है

  2.   पार्डो कहा

    हाँ, एक सवाल है कि मैं कहाँ से डाउनलोड की गई फ़ाइलें सहेज रहा हूँ? वे मुझे मारना चाहते हैं, है ना? जबरदस्त हंसी

    1.    KZKG ^ गारा कहा

      फ़ाइलों को उस फ़ोल्डर में डाउनलोड किया जाता है जहां आप wget the निष्पादित करते समय टर्मिनल में स्थित होते हैं

  3.   ऑरोज़्ज़क्स कहा

    आह, मैंने कल्पना नहीं की थी कि विग का इतना दिलचस्प उपयोग हो सकता है ... अब, साहस द्वारा उल्लिखित उपयोग के बारे में ... कोई शब्द नहीं didn't

  4.   कार्लोस- Xfce कहा

    क्या किसी को पता है कि वहाँ एक वर्डप्रेस प्लग-इन है जो आपके ब्लॉग को डाउनलोड करने से Wget को रोकता है?

  5.   दर्जी कहा

    खैर, यह मेरे लिए बहुत अच्छा है !! धन्यवाद

  6.   पियालावस्की कहा

    बहुत अच्छा, आइए देखें कि कैसे योगदान के लिए धन्यवाद।

  7.   गीतकार कहा

    हालांकि मैं अपने आप को एक शुरुआत मानता हूं कि यह मेरे लिए आसान है अब मैं इसे अन्य चीजों के साथ मिलाने की कोशिश करूंगा और देखूंगा कि यह क्या देता है ...

  8.   Oswaldo कहा

    मुझे उम्मीद है कि आप मेरी मदद कर सकते हैं क्योंकि यह सोमवार, 3 दिसंबर 2012 के लिए है

    विकसित की जाने वाली परियोजना निम्नलिखित है:

    Href संदर्भों को समायोजित करके वेबसाइट का स्थानांतरण।
    1. वेब साइट को ध्यान में रखते हुए, wget कमांड का उपयोग करके पूरी साइट को स्थानीय निर्देशिका में डाउनलोड करें। और अपने लेखक की स्क्रिप्ट के माध्यम से, निम्नलिखित कार्य करें:

    1.1. प्रत्येक प्रकार की सामग्री के लिए एक स्वतंत्र निर्देशिका बनाएं: gif images, jpeg images, etc, avi videos, mpg वीडियो, आदि, एमपी 3 ऑडियो, wav ऑडियो, आदि, वेब सामग्री (HTML, जावास्क्रिप्ट, आदि)।

    1.2. एक बार जब इनमें से प्रत्येक सामग्री को स्थानांतरित कर दिया गया है, तो साइट पर प्रत्येक संसाधन के स्थानीय स्थानों के संदर्भों का समायोजन करें।

    1.3. एक वेब सर्वर को सक्रिय करें और रूट निर्देशिका को कॉन्फ़िगर करें जहां वेब साइट बैकअप स्थानीय वेब सर्वर की रूट निर्देशिका के रूप में स्थित है।

    1.4.-ध्यान दें: wget कमांड का उपयोग केवल निम्नलिखित विकल्पों के साथ किया जा सकता है:
    -सरकारी
    -डॉम्स
    -पेज-अपेक्षित
    यदि किसी कारण से अधिक कमांड आवश्यक हैं, तो आवश्यक का उपयोग करें।

    1.    KZKG ^ गारा कहा

      यहां डाउनलोड करने के लिए मुझे लगता है कि आपके पास पोस्ट में समाधान है, अब ... फ़ाइलों को स्थानांतरित करने और रास्तों को बदलने के लिए, मुझे अपने काम पर कुछ समय पहले ऐसा कुछ करना पड़ा था, मैंने आपके द्वारा उपयोग की गई स्क्रिप्ट को छोड़ दिया: http://paste.desdelinux.net/4670

      आप इसे फ़ाइल के प्रकार और पथ को ध्यान में रखते हुए संशोधित करते हैं, अर्थात, आपकी साइट के .HTML कैसे बने हैं और वह है।

      यह 100% समाधान नहीं है क्योंकि आपको कुछ व्यवस्था या परिवर्तन करना होगा लेकिन, मैं गारंटी देता हूं कि यह सभी काम का 70 या 80% है%

      1.    Oswaldo कहा

        धन्यवाद KZKG ^ गारा मेरे लिए एक बड़ी मदद रही है

  9.   ऋण कहा

    मैंने हमेशा क्रैक का उपयोग किया है। फ़ायरफ़ॉक्स के लिए स्क्रैपबुक मैं इसे आज़माने जा रहा हूं, लेकिन मुझे wget बहुत पसंद है। धन्यवाद!

  10.   डैनियल PZ कहा

    यार, आज्ञा ने मेरे लिए काम नहीं किया ... इसने मेरे लिए अच्छा काम किया:

    wget –random-Wait -r -p -e robots = off -U mozilla http://www.example.com

    1.    डैनियल कहा

      आपका बहुत बहुत धन्यवाद! मैंने इसका उपयोग डैनियल पीजेड द्वारा प्रस्तावित मापदंडों के साथ किया था और मुझे कोई समस्या नहीं थी parameters

  11.   रुबेन अल्मागुएर कहा

    धन्यवाद लड़का, मैंने अपने लिनक्स पिल्ला पर WGet के साथ किया था, लेकिन मुझे नहीं पता था कि यह टर्मिनल में कैसे करना है। अभिनंदन

  12.   पिस्टन कहा

    आप पृष्ठ कहां रखते हैं?

    1.    कुल्हाड़ी कहा

      जहां आपके पास टर्मिनल खुला है। सबसे पहले, अपने उपयोगकर्ता रूट फ़ोल्डर में, जब तक कि आप किसी अन्य पथ को इंगित न करें।

  13.   फर्नांडो कहा

    लिंक भी डाउनलोड करें? तो अगर एक पीडीएफ या किसी अन्य दस्तावेज़ के लिए एक लिंक है, तो क्या आप इसे भी डाउनलोड करते हैं?

  14.   नदी कहा

    मैं अपने पूरे ब्लॉग को डाउनलोड करने के लिए क्या कर सकता हूं, मैंने कोशिश की और जो मैं नहीं देख सकता उसे कोड या ब्लॉक किया गया लगता है, डाउनलोड करने में कई घंटे लगने के बावजूद लेकिन केवल शुरुआती पेज को ही पढ़ा जा सकता है, जिसे मैं डाउनलोड करने की सलाह देता हूं मेरा ब्लॉग, धन्यवाद राउल।

  15.   सिंह कहा

    हैलो, एक संदेह यह html के भीतर लिंक को बदलने के लिए संभव है, बाद में डाउनलोड किए गए पृष्ठ के माध्यम से ब्राउज़ करने में सक्षम हो सकता है जैसे कि यह मूल था।

    क्या होता है कि मैं पृष्ठ को डाउनलोड करता हूं और जब मैंने इसे डाउनलोड की गई फ़ाइलों से खोला तो मैंने .css या .js नहीं लिया और पृष्ठ के लिंक मुझे इंटरनेट पर पृष्ठ पर ले जाते हैं।