ฉันใช้งานเว็บไซต์เวิร์ดเพรสบนเซิร์ฟเวอร์ LEMP ที่ใช้ Ubuntu 20.04
ฉันเปิดใช้งานปลั๊กอิน pagespeed และเพื่อบังคับให้แคชเว็บไซต์ของฉัน ฉันใช้ wget จากกล่องอื่นเพื่อมิเรอร์ไซต์ อย่างไรก็ตาม เมื่อใช้ wget จากช่องที่ 2 จะหยุดการดาวน์โหลดที่หน้าแรก (index.html) โดยมีข้อผิดพลาด
พบแอตทริบิวต์ nofollow ใน /tmp/ramdisk/www.example.com/index.html จะ
ไม่ติดตามลิงค์ใด ๆ ในหน้านี้
ด้านล่างนี้เป็นคำสั่ง wget ที่ฉันใช้และผลลัพธ์ที่ส่งคืน:
wget -m -p -E -k -P /tmp/ramdisk/ https://www.example.com
--2022-05-17 16:41:40-- https://www.example.com/
กำลังแก้ไข www.example.com (www.example.com)... 1**.2*.1**.*
กำลังเชื่อมต่อกับ www.example.com (www.example.com)|1**.2*.1**.*|:443... เชื่อมต่อแล้ว
ส่งคำขอ HTTP แล้ว กำลังรอการตอบกลับ... 200 ตกลง
ความยาว: ไม่ระบุ [ข้อความ/html]
กำลังบันทึกไปที่: â/tmp/ramdisk/www.example.com/index.htmlâ
www.example.com/index.html [ <=> ] 130.71K 210KB/s ใน 0.6 วินาที
ไม่มีส่วนหัวที่แก้ไขล่าสุด -- ปิดการประทับเวลา
2022-05-17 16:41:42 (210 KB/s) - â/tmp/ramdisk/www.example.com/index.htmlâ บันทึกแล้ว [133848]
พบแอตทริบิวต์ nofollow ใน /tmp/ramdisk/www.example.com/index.html จะไม่ติดตามลิงค์ใด ๆ ในหน้านี้
เสร็จแล้ว --2022-05-17 16:41:42--
เวลานาฬิกาแขวนทั้งหมด: 2.0 วินาที
ดาวน์โหลด: 1 ไฟล์ 131K ใน 0.6 วินาที (210 KB/วินาที)
แปลงลิงค์ใน /tmp/ramdisk/www.example.com/index.html... 135.
42-93
แปลงลิงค์เป็น 1 ไฟล์ใน 0.004 วินาที
ฉันจะค้นหาแอตทริบิวต์ nofollow และลบออกได้อย่างไร ดังนั้น wget จะดาวน์โหลดเว็บไซต์ของฉันอย่างสมบูรณ์