Interessant mètode, que vaig descobrir a DiarioLinux, per detectar els links trencats dins d'un lloc web (complet) usant la poderosa eina wget.
Això és súper fàcil de fer en Linux. Vaig obrir un terminal i escriure:
wget --spider --no-parent -r -o log.txt http://tuweb.com
Aquí el funcionament de cada un dels paràmetres:
-spider: recórrer la web que li diguis, però SENSE descarregar res. Només recórrer-la.
- r: recursiu, com si fos el robotet de Google 🙂
- o fitxer: la sortida d'executar la comanda que surti per pantalla
-no-parent: si li passem com a paràmetre un nom de directori, no volem que pugi cap als directoris pare.
És possible que tard una bona estona en acabar (ja que analitza tot el lloc web complet o el directori que li hagis indicat). La llista d'enllaços trencats estarà en log.txt (part final)
En cas que vulguis aprendre més sobre wget, vaig escriure
home wget