Score:1

เหตุใด Google จึงสแปมไซต์ Wordpress ของฉันด้วยคำค้นหาการออกเดท

ธง br

ฉันมีไซต์ Wordpress ที่โดนคำขอมากกว่า 100,000 รายการต่อวันด้วยคำขอเดียวกันด้านล่าง GET ทั้งหมดเหล่านี้มาจาก IP ที่แตกต่างกันประมาณ 200 รายการภายใน Google netrange เดียวกัน (66.249.x.x) ไม่มี /ค้นหา/ เส้นทางบนไซต์ แต่บางสิ่งใน Wordpress (Relevansi?) ต้องประมวลผลคำขอนี้เนื่องจากมีข้อผิดพลาดในการเรียง UTF-8 ในฐานข้อมูล ซึ่งอาจเป็นเพราะอิโมจิหรืออักขระซีริลลิก:

ข้อผิดพลาดของฐานข้อมูล WordPress การผสมผสานที่ผิดกฎหมาย (utf8_general_ci,IMPLICIT) และ (utf8mb4_unicode_ci,COERCIBLE) สำหรับ การดำเนินการ 'ชอบ' สำหรับการค้นหา \n\t\t\tSELECT COUNT(DISTINCT(relevanssi.doc))\n\t\t\t\tจาก 49qi0c_relevanssi AS ความเกี่ยวข้อง\n\t\t\t\t ที่ไหน (relevanssi.term LIKE 'เบอร์แบต\xf0\x9f\xaa\x80\xe2\x9d\xa4\xef\xb8\x8f\xef\xb8\x8fwww%' หรือ relevanssi.term_reverse ชอบ CONCAT(ย้อนกลับ('berbat\xf0\x9f\xaa\x80\xe2\x9d\xa4\xef\xb8\x8f\xef\xb8\x8fwww'), '%')) ทำโดย need('wp-blog-header.php'), wp, WP->main, WP->query_posts, WP_Query->query, WP_Query->get_posts, apply_filters_ref_array('posts_pre_query'), WP_Hook->apply_filters, relevanssi_query, relevanssi_do_query, relevanssi_search, relevanssi_search, relevanssi_generate_df_counts, QM_DB->แบบสอบถาม

ฉันตรวจสอบฟอรัม Relevansi และพบว่ามีคนโพสต์ปัญหาเดียวกันเกือบทั้งหมดมันถูกกล่าวว่า 'ไม่เป็นอันตราย' และดูเหมือนจะไม่สร้างความกังวลให้ใคร ดังนั้นเธรดจึงถูกปิด ประเด็นก็คือ ภาระที่แท้จริงของคำขอเหล่านี้เริ่มทำให้ไซต์ล้าหลัง และข้อผิดพลาดที่ถูกสร้างขึ้นกำลังเติมเต็มบันทึกภายใต้ /var/ พาร์ทิชัน ฉันถูกบล็อก /19 จาก Google ในขณะนี้ แต่อาจไม่ใช่คำตอบที่ถูกต้องเนื่องจากเป็น Google (การจัดอันดับหน้าและทั้งหมดนั้น) ใครเคยเจอแบบนี้จาก Google มาก่อนบ้าง?

รับ /search/%F0%9F%AA%80BEST+DATING+SITE%E2%9D%A4%EF%B8%8F%EF%B8%8F%C4%B0ngiliz+kad%C4%B1n+i%C3%A7+% C3%A7ama%C5%9F%C4%B1r%C4%B1+gal+r%C3%B6ntgenci+%C3%B6n%C3%BCnde+berbat%F0%9F%AA%80%E2%9D%A4%EF% B8%8F%EF%B8%8FWww.MtSp.XyZ%F0%9F%AA%80%E2%9D%A4%EF%B8%8F%EF%B8%8F%C4%B0ngiliz+kad%C4%B1n+ i%C3%A7+%C3%A7ama%C5%9F%C4%B1r%C4%B1+gal+r%C3%B6ntgenci+%C3%B6n%C3%BCnde+berbat+%C4%B0ngiliz+kad%C4%B1n+ i%C3%A7+%C3%A7ama%C5%9F%C4%B1r%C4%B1+gal+r%C3%B6ntgenci+%C3%B6n%C3%BCnde+berbat+%C4%B0ngiliz+kad%C4%B1n+ i%C3%A7+%C3%A7ama%C5%9F%C4%B1r%C4%B1+gal+r%C3%B6ntgenci+%C3%B6n%C3%BCnde+berbat/feed/rss2/?page_number_9=1&page_number_15=7&page_number_14 =3&page_number_16=3&page_number_10=1&page_number_12=33&page_number_17=3&page_number_13=3&page_number_11=17 HTTP/1.1" 200 718084 "-" "Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML เช่น Gecko) Chrome/97.0.4692.71 Mobile Safari/537.36 (เข้ากันได้; Googlebot/2.1; +http://www.google.com/bot.html)

vn flag
คุณสามารถให้ตัวอย่าง IP จริงของสิ่งเหล่านี้ได้หรือไม่? ลักษณะนี้โดยพื้นฐานแล้วดูเหมือนสแปมผู้อ้างอิง (บางไซต์แสดง "การค้นหายอดนิยม/ล่าสุด" ในแถบด้านข้าง) อาจเป็นเซิร์ฟเวอร์ที่ถูกบุกรุกในแพลตฟอร์มคลาวด์ของ Google ไม่ใช่ GoogleBot จริง ยืนยันที่ https://developers.google.com/search/docs/advanced/crawling/verifying-googlebot
Nstevens avatar
br flag
แน่นอน หนึ่ง IP คือ 66.249.70.19 อยู่ในช่วง #21 ที่นี่: https://www.gstatic.com/ipranges/goog.json ฉันคิดว่ามี IP บางตัวที่ไม่ได้อยู่ใน netblock นั้น แต่ส่วนใหญ่มี ฉันจะตรวจสอบข้อมูลที่คุณโพสต์ ขอบคุณ!
vn flag
น่าสนใจ; มันติดตามกลับไปที่ GoogleBot ฉันสงสัยว่ามีคนใช้ "รวบรวมข้อมูลเป็น GoogleBot" ใน Google Search Console ในทางที่ผิด หรือสร้างหน้าที่ชี้ไปที่ URL การค้นหาเหล่านี้ซึ่ง Google รวบรวมข้อมูลและถือว่ามีเจตนาดี
Nstevens avatar
br flag
ไม่แน่ใจว่าฟีเจอร์นั้นคืออะไร แต่ฉันจะเรียกใช้โดยผู้ดูแลระบบ WP ของเรา เขากังวลว่าบางสิ่งในปลั๊กอิน SEO ของเขาอาจบอกให้ Google รวบรวมข้อมูลไซต์สำหรับคำเหล่านั้น มีข้อเสนอแนะอื่นซึ่งอาจเป็นโฮสต์ของ Google App Engine (การโฮสต์ VM หรือไม่) ฉันไม่เชี่ยวชาญในบริการของ Google แต่ดูเหมือนว่าจะเหมาะสม
in flag
ใช้คอนโซลการค้นหาของ Google ซึ่งอาจบอกคุณได้ว่าทำไม หรืออย่างน้อยก็ได้รับคำแนะนำหลังจากผ่านไป 2-3 วัน
jp flag
เพิ่ม `/search/ ใน `robots.txt`
Nstevens avatar
br flag
ฉันหวังว่ามันจะง่ายขนาดนั้น `robots.txt` เป็นเพียงดุลยพินิจเท่านั้น ลูกค้าทุกคนสามารถเพิกเฉยได้
vn flag
@Nstevens แม้ว่า GoogleBot **แน่นอน** จะเคารพก็ตาม
Nstevens avatar
br flag
อาโอเค. ฉันเห็นสิ่งที่คุณพูดตอนนี้ @AlexD ขอบคุณ.

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา