ฉันพยายามหาว่าเกิดอะไรขึ้นกับเซิร์ฟเวอร์บางตัวของเรา เหล่านี้คือโฮสต์ KVM ที่มี 5 -8 VM RAM >= 64GB, 10 - 20 คอร์ สิ่งเหล่านี้กำลังเรียกใช้เคอร์เนล Ubuntu 18.04 LTS 4.15.0-142-generic, LUKS เข้ารหัสพาร์ติชันรูท ext4
เซิร์ฟเวอร์เหล่านี้บางส่วนจะช้ามากแบบสุ่ม ตัวบ่งชี้ทั้งหมดจะชี้ไปที่ Disk IO แต่จริงๆ แล้วมีปริมาณงานไม่มากนักที่ใช้ IO (pidstat, iostat, vmstat) กล่าวโดยย่อคือระบบจะเข้าสู่สถานะล็อคแปลก ๆ ซึ่งทุกอย่างจะช้าและไม่ตอบสนอง
สิ่งหนึ่งที่ดูเหมือนจะพบได้ทั่วไปกับเซิร์ฟเวอร์ที่ไม่แข็งแรง การเขียนกลับจะสูง ~ 2.5GB และจะติดอยู่ที่ค่านั้นโดยไม่มีการเปลี่ยนแปลงใดๆ นี่อาจเป็นอาการหรือสาเหตุฉันไม่รู้จริงๆ ฉันกำลังทดลองลด Dirty_ratio แต่ยังบอกไม่ได้ว่าได้ผล
สกปรก: 1504 กิโลไบต์
การเขียนกลับ: 2537628 kB
นี่คือการติดตามการโทรของงานค้างที่รวบรวมโดยใช้ Sysrq-w
การติดตามการโทรสำหรับงานที่ติดอยู่
ฉันได้พยายามเชื่อมโยงปัญหากับฮาร์ดแวร์และพบว่าสิ่งนี้ส่งผลต่อฮาร์ดแวร์ดิสก์ที่แตกต่างกัน
การรีสตาร์ทดูเหมือนจะแก้ไขปัญหาได้ชั่วคราว บางครั้งสิ่งนี้จะกลับมาหลังจากผ่านไปสองสามวัน
ความคิดใด ๆ ที่จะเป็นประโยชน์ แจ้งให้เราทราบหากคุณต้องการข้อมูลเพิ่มเติม
ขอบคุณล่วงหน้า