Score:0

การแคช Nginx ไม่ทำงานสำหรับโปรแกรมรวบรวมข้อมูล

ธง br

ฉันใช้การแคช Nginx มาหลายปีแล้ว แต่เพิ่งสังเกตเห็นปัญหาที่ฉันสงสัยว่าเกิดขึ้นมาหลายปีแล้ว

หากฉันเข้าถึงหน้าเว็บที่ไม่เคยมีใครเข้าชมมาก่อน แน่นอนว่าฉันจะได้รับแคชที่พลาด ให้รีเฟรชหน้านั้น และตอนนี้แคชก็โดน

อย่างไรก็ตาม ฉันสังเกตเห็นว่าเมื่อโปรแกรมรวบรวมข้อมูล เช่น Bingbot หรือ Googlebot รวบรวมข้อมูลไซต์ หน้าเว็บที่พวกเขารวบรวมข้อมูลจะไม่ถูกแคช พวกเขาจะไม่ได้รับแคชเสมอจนกว่าฉันจะเข้าไปที่ไซต์เหล่านั้นด้วยตนเอง

มีการตั้งค่าที่ไหนสักแห่งใน Nginx ที่ป้องกันการรับส่งข้อมูลของบอทจากการแคชเพจหรือไม่?

FYI ฉันไม่ได้ปฏิบัติต่อบอทแตกต่างไปจากผู้ใช้ในการกำหนดค่า Nginx ของฉัน

นี่คือตัวอย่างการกำหนดค่าของฉัน

    proxy_socket_keepalive บน;
    ปิด proxy_redirect;
    proxy_cache Google-แคช;
    เปิด proxy_cache_revalidate;
    proxy_ignore_headers หมดอายุการควบคุมแคช;
    ข้อผิดพลาด proxy_cache_use_stale หมดเวลาอัปเดต http_500 http_502 http_503 http_504;   
    เปิด proxy_cache_background_update; 
    เปิด proxy_cache_lock;


   proxy_cache_valid 200 206 304 306 301 302 404 410 300s;
Michael Hampton avatar
cz flag
`proxy_cache_key` ของคุณคืออะไร

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา