Цікавий метод, який я виявив у DiarioLinux, для виявлення непрацюючих посилань на веб-сайті (повний) за допомогою потужного інструменту Wget.
Це дуже просто зробити в Linux. Я відкрив термінал і написав:
wget --spider --no -parent -r -o log.txt http://tuweb.com
Ось робота кожного з параметрів:
–Spider: пройдіть веб, що ви їм скажете, але БЕЗ завантаження нічого. Просто пройдіться.
- r: рекурсивно, ніби це робот Google 🙂
- o файл: результат виконання команди, що з'являється на екрані
–Не батьківський: якщо ми передаємо ім’я каталогу як параметр, ми не хочемо, щоб воно переходило до батьківських каталогів.
Завершення може зайняти багато часу (оскільки сканує весь веб-сайт або каталог, який ви вказали). Список непрацюючих посилань буде в log.txt (заключна частина)
Якщо ви хочете дізнатись більше про wget, я писав
людина wget