طريقة مثيرة للاهتمام ، اكتشفتها في DiarioLinux ، لاكتشاف الروابط المعطلة داخل موقع الويب (كاملة) باستخدام الأداة القوية مجلد مشترك.
من السهل جدًا القيام بذلك على Linux. فتحت المحطة وكتبت:
wget - spider - no-parent -r -o log.txt http://tuweb.com
هنا تشغيل كل من المعلمات:
- العنكبوت: تصفح الويب التي تخبرهم بها ، لكن دون تنزيل أي شيء. مجرد المشي.
- r: متكرر كأنه روبوت جوجل 🙂
- o file: ناتج تنفيذ الأمر الذي يظهر على الشاشة
- بدون أب: إذا مررنا اسم دليل كمعامل ، فإننا لا نريده أن يصعد إلى الدلائل الأصلية.
قد يستغرق الأمر وقتًا طويلاً للانتهاء (حيث يقوم بمسح موقع الويب بالكامل أو الدليل الذي أشرت إليه). ستكون قائمة الروابط المعطلة في log.txt (الجزء الأخير)
كتبت في حال كنت تريد معرفة المزيد عن wget
الرجل wget