Score:0

วิธีหลีกเลี่ยงอีเมลที่ส่งไปยังโปรแกรมรวบรวมข้อมูลเว็บเชิงลึกของ Google

ธง jp

เว็บไซต์ของฉันมีพื้นที่จำกัดสำหรับผู้ใช้ที่ลงทะเบียนด้วยอีเมลที่ถูกต้อง ฉันได้รับคำขอเกี่ยวกับอีเมลปลอม และฉันต้องการหลีกเลี่ยงการส่งอีเมลไปยังที่อยู่ที่ไม่มีอยู่จริง เกรงว่าที่อยู่เหล่านั้นจะเพิ่มอัตราตีกลับและทำลายชื่อเสียงในการส่งของฉัน

อีเมลคือ:

[email protected]
[email protected]
kWQcHVzn%40ypEcDvh.NwB

อันสุดท้ายมี %40เอนทิตี HTML สำหรับ @. อีเมลมีการตัดตอนของลำดับอักขระเดียวกัน

การตรวจสอบที่อยู่ IP ของคำขอด้วย DNS ย้อนกลับ คำขอทั้งสามมาจาก cache.google.com. หากคำขอมาจากโปรแกรมรวบรวมข้อมูลของ Google ฉันคาดว่าที่อยู่อีเมลเหล่านี้จะได้รับการบันทึกไว้ แต่ไม่พบข้อมูลอ้างอิงใดๆ

ในกรณีที่เป็นโปรแกรมรวบรวมข้อมูลของ Google ฉันต้องการให้จัดทำดัชนีเว็บไซต์ในขณะที่หลีกเลี่ยงการส่งที่อยู่อีเมลไปยังที่อยู่ปลอม ฉันได้ทำการกรองที่อยู่เพื่อค้นหาลำดับอักขระนั้นแล้ว

มีรายการที่อยู่ปลอมที่โปรแกรมรวบรวมข้อมูลเว็บลึกใช้เพื่อเข้าถึงและจัดทำดัชนีหน้าที่ซ่อนอยู่หรือไม่

อัปเดต

ตามคำตอบและความคิดเห็นที่ชี้ไปที่ ยืนยันว่า Googlebot เป็นโปรแกรมรวบรวมข้อมูลฉันยืนยันว่าไม่ใช่:

$ โฮสต์ 212.113.167.197
197.167.113.212.in-addr.arpa ตัวชี้ชื่อโดเมน cache.google.com
$ โฮสต์ cache.google.com
ไม่พบโฮสต์ cache.google.com: 3(NXDOMAIN)

ดูเหมือนว่าจะเป็นผู้ใช้ที่เป็นอันตราย ซึ่งอธิบายได้ว่าทำไมที่อยู่อีเมลนั้นจึงไม่ได้รับการบันทึกไว้ว่ามาจาก Google

vn flag
พิจารณาบล็อก URL ของแบบฟอร์มอีเมลใน robots.txtหรือแคปช่า? ฉัน *เข้าใจ* บอตของ Google จะไม่พยายามถอดรหัสแคปต์ชาของตัวเอง...
miguelmorin avatar
jp flag
นั่นเป็นความคิดที่ดี เขียนตอบได้ไหม
Score:3
ธง kr
Bob

การตรวจสอบที่อยู่ IP ของคำขอด้วย DNS ย้อนกลับ คำขอทั้งสามมาจาก cache.google.com.

เมื่อทำการค้นหาแบบย้อนกลับ อย่าลืมตรวจสอบว่าการค้นหาชื่อโฮสต์แบบไปข้างหน้าชี้ไปยังที่อยู่ IP ที่คุณกำลังตรวจสอบหรือไม่

> โฮสต์ 66.249.66.1
ตัวชี้ชื่อโดเมน 1.66.249.66.in-addr.arpa crawl-66-249-66-1.googlebot.com

> โฮสต์ crawl-66-249-66-1.googlebot.com
crawl-66-249-66-1.googlebot.com มีที่อยู่ 66.249.66.1

เมื่อระเบียน DNS ย้อนกลับและส่งต่อสอดคล้องกับคุณ เช่นในตัวอย่างนี้ คุณก็จะเชื่อถือข้อมูลนั้นได้ มิฉะนั้นคุณอาจมีผู้ดูแลระบบที่เลอะเทอะหรือตัวอย่างของผู้โจมตีที่พยายามซ่อนแหล่งที่มา

โปรดใช้การค้นหา Whois บนที่อยู่ IP แทนการค้นหา DNS ย้อนกลับเพื่อระบุเจ้าของเมื่อตรวจสอบการละเมิด

ไม่ว่าบันทึก DNS ย้อนกลับโดยเฉพาะอย่างยิ่งที่อยู่ IP ของผู้โจมตีจะแก้ไขเป็นข้อมูลที่ไม่น่าเชื่อถือเสมอไป

โปรดทราบว่าเจ้าของช่วงที่อยู่ IP สามารถตั้งค่าใดก็ได้ที่ต้องการในระเบียน DNS ย้อนกลับ ไม่มีข้อจำกัดว่าพวกเขาสามารถใช้ชื่อโฮสต์ที่พวกเขาเป็นเจ้าของเท่านั้น และไม่มีข้อจำกัดทางเทคนิคโดยธรรมชาติใดๆ ที่บันทึก DNS ย้อนกลับต้องตรงกับบันทึก DNS ที่ส่งต่อ
(แม้ว่าผู้ให้บริการที่ขยันขันแข็งส่วนใหญ่จะพยายามบังคับใช้เมื่อพวกเขาอนุญาตให้ลูกค้าตั้งค่าระเบียน DNS ย้อนกลับที่กำหนดเองในที่อยู่ IP สาธารณะที่พวกเขาใช้)

การตั้งค่าระเบียน DNS ย้อนกลับปลอมเป็นกลอุบายจากคลังแสงที่ผู้โจมตีบางรายสามารถใช้เพื่อซ่อนร่องรอยและ/หรือเพื่อให้ดูมีเมตตามากขึ้นเมื่อพยายามหลีกเลี่ยงการควบคุมการเข้าถึง

miguelmorin avatar
jp flag
ขอขอบคุณ! ข้อความค้นหา Whois บนที่อยู่ IP (https://www.whois.com/whois/x.x.x.x) แสดงว่ามาจากผู้ให้บริการอินเทอร์เน็ต และไม่แสดงรายการ `cache.google.com` ที่ใดก็ได้ในบันทึก หากคำขอนั้นมาจากบอทของ Google จริง ๆ คำขอเหล่านั้นควรระบุชื่อโดเมน `google.com` หรือไม่
kr flag
Bob
โปรดดู https://developers.google.com/search/docs/advanced/crawling/verifying-googlebot สำหรับคำแนะนำ ซึ่งรวมถึงการยืนยันว่าระเบียน DNS ย้อนกลับที่ใช้ตรงกับระเบียนที่ส่งต่อจริงๆ

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา