Kaip gauti sugadintų nuorodų sąrašą iš svetainės

Įdomus metodas, kurį atradau DiarioLinux, aptikti neveikiančias nuorodas (visoje) svetainėje naudojant galingą įrankį wget.

Tai labai lengva padaryti naudojant „Linux“. Atsidariau terminalą ir įvedžiau:

wget --spider --no-parent -r -o log.txt http://tuweb.com

Čia yra kiekvieno parametro veikimas:

–voras: naršykite svetainėje, kuriai nurodėte, bet nieko neatsisiųsdami. Tiesiog eik per jį.
– r: rekursyvus, tarsi tai būtų „Google“ robotas 🙂
– arba failas: ekrane rodomos komandos vykdymo išvestis
–no-parent : jei perduodame jam katalogo pavadinimą kaip parametrą, nenorime, kad jis patektų į pirminius katalogus.

Tai gali užtrukti, kol bus baigta (nes nuskaitoma visa svetainė arba katalogas, kurį jai suteikėte). Neveikiančių nuorodų sąrašas bus log.txt (paskutinė dalis)

Jei norite sužinoti daugiau apie wget, parašiau

vyras wget

Palikite komentarą

Jūsų elektroninio pašto adresas nebus skelbiamas. Privalomi laukai yra pažymėti *

*

*

  1. Atsakingas už duomenis: Miguel Ángel Gatón
  2. Duomenų paskirtis: kontroliuoti šlamštą, komentarų valdymą.
  3. Įteisinimas: jūsų sutikimas
  4. Duomenų perdavimas: Duomenys nebus perduoti trečiosioms šalims, išskyrus teisinius įsipareigojimus.
  5. Duomenų saugojimas: „Occentus Networks“ (ES) talpinama duomenų bazė
  6. Teisės: bet kuriuo metu galite apriboti, atkurti ir ištrinti savo informaciją.