Як отримати список непрацюючих посилань з веб-сайту

Цікавий метод, який я виявив у DiarioLinux, для виявлення непрацюючих посилань на веб-сайті (повний) за допомогою потужного інструменту Wget.

Це дуже просто зробити в Linux. Я відкрив термінал і написав:

wget --spider --no -parent -r -o log.txt http://tuweb.com

Ось робота кожного з параметрів:

–Spider: пройдіть веб, що ви їм скажете, але БЕЗ завантаження нічого. Просто пройдіться.
- r: рекурсивно, ніби це робот Google 🙂
- o файл: результат виконання команди, що з'являється на екрані
–Не батьківський: якщо ми передаємо ім’я каталогу як параметр, ми не хочемо, щоб воно переходило до батьківських каталогів.

Завершення може зайняти багато часу (оскільки сканує весь веб-сайт або каталог, який ви вказали). Список непрацюючих посилань буде в log.txt (заключна частина)

Якщо ви хочете дізнатись більше про wget, я писав

людина wget

Залиште свій коментар

Ваша електронна адреса не буде опублікований. Обов'язкові для заповнення поля позначені *

*

*

  1. Відповідальний за дані: Мігель Анхель Гатон
  2. Призначення даних: Контроль спаму, управління коментарями.
  3. Легітимація: Ваша згода
  4. Передача даних: Дані не передаватимуться третім особам, за винятком юридичних зобов’язань.
  5. Зберігання даних: База даних, розміщена в мережі Occentus Networks (ЄС)
  6. Права: Ви можете будь-коли обмежити, відновити та видалити свою інформацію.