ฉันใช้ Apache 2 กับเซิร์ฟเวอร์ PHP 7.4.29 บน Ubuntu 20.04 บน AWS โดยใช้ AWS load balancer และ auto scaling group เซิร์ฟเวอร์เชื่อมต่อกับทรัพยากร AWS อื่นๆ เช่น dynamodb, RDS (mysql), memcache เป็นต้น
นี่คือสภาพแวดล้อมการผลิตที่เสถียรซึ่งทำความเร็วได้ 10Ks/Hit ต่อนาทีตามปกติและทำงานได้อย่างไร้ที่ติ
เมื่อเร็ว ๆ นี้เรามีทราฟฟิกปกติสูงสุด X3 และเซิร์ฟเวอร์เริ่มมีเวลาตอบสนองช้า
New Relic แสดงเฉพาะว่าเวลาของ PHP นั้นใหญ่กว่าสำหรับธุรกรรมเหล่านี้ และไม่ได้ชี้ไปที่บริการเฉพาะ
ปัญหาคือ ณ เวลาที่กำหนด เซิร์ฟเวอร์เหล่านี้บางตัวมีเวลาตอบสนองปกติ
(~30 msec) และบางส่วนมีเวลาตอบสนองช้า (~500 msec) และสิ่งนี้จะสลับระหว่างเซิร์ฟเวอร์
ดังนั้น ดูเหมือนว่าการชะลอตัวจะไม่เกี่ยวข้องกับบริการภายนอก เช่น RDS เนื่องจากบริการจะเหมือนกันสำหรับเซิร์ฟเวอร์ทั้งหมด
ฉันกำลังแนบเวลาตอบสนองของเซิร์ฟเวอร์ทั้งหมดที่ใช้งานในช่วงเวลาที่กำหนด
พฤติกรรมดังกล่าวสามารถทำให้เกิดอะไรได้บ้าง?
TLDR: ฉันถามถึงวิธีค้นหาสาเหตุของเวลาตอบสนองของเซิร์ฟเวอร์ PHP / Apache ที่ช้าลงเมื่อไม่ได้เกิดขึ้นพร้อมกันบนเซิร์ฟเวอร์ทั้งหมด (ดังนั้นจึงไม่ใช่บริการที่ใช้ร่วมกันภายนอก) และของที่ระลึกใหม่จะแสดงเป็นเวลา PHP ใน การทำธุรกรรมโดยไม่มีข้อมูลเพิ่มเติม