Cómo obtener listado de links rotos de un sitio web

Interesante método, que descubrí en DiarioLinux, para detectar los links rotos dentro de un sitio web (completo) usando la poderosa herramienta wget.

Esto es súper fácil de hacer en Linux. Abrí un terminal y escribí:

wget --spider --no-parent -r -o log.txt http://tuweb.com

Aquí el funcionamiento de cada uno de los parámetros:

–spider : recorrer la web que le digas, pero SIN descargar nada. Sólo recorrerla.
– r : recursivo, como si fuera el robotito de Google 🙂
– o fichero : la salida de ejecutar el comando que salga por pantalla
–no-parent : si le pasamos como parámetro un nombre de directorio, no queremos que suba hacia los directorios padre.

Es posible que tarde un buen rato en terminar (ya que analiza todo el sitio web completo o el directorio que le hayas indicado). La lista de enlaces rotos estará en log.txt (parte final)

En caso de que quieras aprender más sobre wget, escribí

man wget

Sé el primero en comentar

Deja tu comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*

*

  1. Responsable de los datos: Miguel Ángel Gatón
  2. Finalidad de los datos: Controlar el SPAM, gestión de comentarios.
  3. Legitimación: Tu consentimiento
  4. Comunicación de los datos: No se comunicarán los datos a terceros salvo por obligación legal.
  5. Almacenamiento de los datos: Base de datos alojada en Occentus Networks (UE)
  6. Derechos: En cualquier momento puedes limitar, recuperar y borrar tu información.