Score:0

พยายามจำลองเว็บไซต์ของฉันด้วย wget แต่พบแอตทริบิวต์ nofollow และฉันไม่สามารถดาวน์โหลดอะไรมากไปกว่า index.html

ธง mx

ฉันใช้งานเว็บไซต์เวิร์ดเพรสบนเซิร์ฟเวอร์ LEMP ที่ใช้ Ubuntu 20.04 ฉันเปิดใช้งานปลั๊กอิน pagespeed และเพื่อบังคับให้แคชเว็บไซต์ของฉัน ฉันใช้ wget จากกล่องอื่นเพื่อมิเรอร์ไซต์ อย่างไรก็ตาม เมื่อใช้ wget จากช่องที่ 2 จะหยุดการดาวน์โหลดที่หน้าแรก (index.html) โดยมีข้อผิดพลาด

พบแอตทริบิวต์ nofollow ใน /tmp/ramdisk/www.example.com/index.html จะ ไม่ติดตามลิงค์ใด ๆ ในหน้านี้ ด้านล่างนี้เป็นคำสั่ง wget ที่ฉันใช้และผลลัพธ์ที่ส่งคืน:

wget -m -p -E -k -P /tmp/ramdisk/ https://www.example.com
--2022-05-17 16:41:40-- https://www.example.com/
กำลังแก้ไข www.example.com (www.example.com)... 1**.2*.1**.*
กำลังเชื่อมต่อกับ www.example.com (www.example.com)|1**.2*.1**.*|:443... เชื่อมต่อแล้ว
ส่งคำขอ HTTP แล้ว กำลังรอการตอบกลับ... 200 ตกลง
ความยาว: ไม่ระบุ [ข้อความ/html]
กำลังบันทึกไปที่: â/tmp/ramdisk/www.example.com/index.htmlâ

www.example.com/index.html [ <=> ] 130.71K 210KB/s ใน 0.6 วินาที

ไม่มีส่วนหัวที่แก้ไขล่าสุด -- ปิดการประทับเวลา
2022-05-17 16:41:42 (210 KB/s) - â/tmp/ramdisk/www.example.com/index.htmlâ บันทึกแล้ว [133848]

พบแอตทริบิวต์ nofollow ใน /tmp/ramdisk/www.example.com/index.html จะไม่ติดตามลิงค์ใด ๆ ในหน้านี้
เสร็จแล้ว --2022-05-17 16:41:42--
เวลานาฬิกาแขวนทั้งหมด: 2.0 วินาที
ดาวน์โหลด: 1 ไฟล์ 131K ใน 0.6 วินาที (210 KB/วินาที)
แปลงลิงค์ใน /tmp/ramdisk/www.example.com/index.html... 135.
42-93
แปลงลิงค์เป็น 1 ไฟล์ใน 0.004 วินาที

ฉันจะค้นหาแอตทริบิวต์ nofollow และลบออกได้อย่างไร ดังนั้น wget จะดาวน์โหลดเว็บไซต์ของฉันอย่างสมบูรณ์

Score:1
ธง in

เนื่องจาก บันทึกไว้ที่นี่ คุณสามารถบอก wget ให้ละเว้นแอตทริบิวต์ไม่ติดตามโดยเพิ่มพารามิเตอร์ -e หุ่นยนต์ = ปิด

DanRan avatar
mx flag
แต่ไม่กี่วันที่ผ่านมา ฉันไม่จำเป็นต้องใช้สิ่งนี้ใน wget ฉันเปลี่ยนแปลงอะไรบนเซิร์ฟเวอร์ของฉันที่สร้างลิงก์ไม่ติดตาม
in flag
เราจะรู้ได้อย่างไร?
DanRan avatar
mx flag
นั่นคือสิ่งที่ฉันถาม รัฐประหารเรารู้จริงแค่ไหน? มีวิธีการค้นหาลิงก์เหล่านั้นในไดเร็กทอรี wordpress ของฉันหรืออะไรไหม
Score:0
ธง mx

ฉันคิดออก

ฉันต้องเข้าสู่การติดตั้ง wordpress ผ่านเว็บอินเตอร์เฟสและไปที่ การตั้งค่า> การอ่าน> การเปิดเผยของเครื่องมือค้นหาจากนั้นในหน้านั้นฉันต้องยกเลิกการเลือก

กีดกันเครื่องมือค้นหาจากการจัดทำดัชนีไซต์นี้ ขึ้นอยู่กับการค้นหา เครื่องยนต์เพื่อตอบสนองคำขอนี้

ตัวเลือก. หลังจากยกเลิกการเลือกแล้ว ฉันสามารถมิเรอร์ไซต์ของฉันได้สำเร็จโดยใช้คำสั่ง wget wget -m -p -E -k -P /tmp/ramdisk/ https://www.example.com.

ดูภาพหน้าจอด้านล่างสำหรับข้อมูลเพิ่มเติม Wordpress - การแสดงผลของเครื่องมือค้นหา - กีดกันเครื่องมือค้นหาจากการจัดทำดัชนีไซต์นี้

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา