ฉันมีการติดตั้ง 3 VMs (1 เซิร์ฟเวอร์แอปพลิเคชันบน CentOS6 และ 2 เซิร์ฟเวอร์ฐานข้อมูลบน CentOS7)ในช่วง 1-2 สัปดาห์ที่ผ่านมา เรามีปัญหาเกี่ยวกับการหมดเวลาเมื่อเชื่อมต่อกับเซิร์ฟเวอร์ฐานข้อมูล (และระหว่างเซิร์ฟเวอร์สองเครื่องที่อยู่ในคลัสเตอร์)
ผู้ให้บริการฐานข้อมูล (Couchbase) สามารถดูได้จากบันทึกว่าการเชื่อมต่อถูกบังคับปิด:
เตือน com.couchbase.endpoint - [com.couchbase.endpoint][UnexpectedEndpointDisconnectedEvent] ด้านระยะไกลตัดการเชื่อมต่อจุดสิ้นสุดโดยไม่คาดคิด
บันทึกยังแสดงว่าแพ็คเกจหลุด เช่น:
[คำเตือน] อินเทอร์เฟซ âens32â (removedip) ล้มเหลว: RX:2863 / TX:0 - รายละเอียด:
- แพ็กเก็ต RX:308,593,167 ข้อผิดพลาด:0
หลุด:2,863 โอเวอร์รัน:0 เฟรม:0
VMs ถูกโฮสต์บนโฮสต์เดียวกันซึ่งเป็น VMware ESXi (เวอร์ชัน 6.5) ดังนั้นพวกเขา ควร สามารถมีความสัมพันธ์ที่ดีต่อกันได้
และมีอะไรเปลี่ยนแปลงไปบ้างในช่วง 2-3 สัปดาห์ที่ผ่านมา? การอัปเดตความปลอดภัยบน VM OSes และเวอร์ชันเซิร์ฟเวอร์ฐานข้อมูล (จาก 6.6.0 เป็น 7.0.0) การอัพเกรดฐานข้อมูล ไม่ควร เปลี่ยนแปลงอะไรในเครือข่าย แต่ที่แน่ๆ คือเหตุผลที่ติดต่อผู้ให้บริการฐานข้อมูลก่อน...
ความคิดใด ๆ ในการค้นหาผู้กระทำผิดชื่นชมมาก :-)
แก้ไข:
ทำตามคำแนะนำของ Cameron ฉันเพิ่งเรียกใช้การติดตามเครือข่ายสั้น ๆ และโหลดลงใน Wireshark บนเครื่องท้องถิ่นของฉัน จากนั้นฉันเปิด "ข้อมูลผู้เชี่ยวชาญ" และได้รับสิ่งนี้:
ฉันต้องบอกว่ามีพร็อกซีเซิร์ฟเวอร์ Nginx อยู่หน้าแอปพลิเคชันเซิร์ฟเวอร์ จัดการ SSL และ "ยกออก" ก่อนที่จะกดแอป เซิร์ฟเวอร์ แค่ดูข้อมูล ฉันคาดว่าบล็อก "สีแดง" สองบล็อกจะเกี่ยวข้องกับคำขอที่มาจากภายนอก ไม่ใช่จากแอป เซิร์ฟเวอร์ไปยังเซิร์ฟเวอร์ฐานข้อมูล
แต่ฉันไม่แน่ใจจริง ๆ ว่าจะมองหาอะไรในผลลัพธ์? - และฉันเดาว่าฉันต้องปล่อยให้มันทำงานต่อไปอีกหน่อย - แต่บางทีอาจไม่มีข้อมูลจากภายนอก?
แก้ไข 2
ขณะที่นั่งดูปัญหาก็เกิดขึ้นจริง... - ดังนั้นฉันจึงเริ่ม tcpdump อีกครั้งอย่างรวดเร็ว ดังนั้นผลลัพธ์อาจไม่มีต้นตอ - แต่ควรมีความเกี่ยวข้องมากกว่าสาเหตุแรก:
บล็อกที่ฉันขยายดูเหมือนจะเกี่ยวข้องกับการสื่อสารกับหนึ่งในเซิร์ฟเวอร์ฐานข้อมูล.... :-)
แต่ผลลัพธ์เหล่านี้หมายความว่าอย่างไร และฉันจะเข้าใกล้สาเหตุได้อย่างไร