Score:0

prometheus แจ้งเตือน Kubernetes ที่ทำงานผิดพลาด

ธง gb

ในคลัสเตอร์ K8s ฉันมี Prometheus Operator และ AlertManager ทำงานอยู่

ฉันมีการแจ้งเตือนนี้เพื่อตรวจจับเหตุการณ์เมื่อพ็อดวิกฤตหยุดทำงาน:

 - การแจ้งเตือน: KubernetesContainerMission-gslNotRunning
    expr: kube_pod_status_ready{condition="false", pod=~"mission-gsl.*"} == 1 OR on() vector(0)
    สำหรับ: 5m
    ป้ายกำกับ:
      ความรุนแรง: คำเตือน
      สภาพแวดล้อม: PRODUCTION_ENV
    คำอธิบายประกอบ:
      สรุป: พ็อดภารกิจ CUSTOM-gsl ไม่ทำงานนานกว่า 5 นาที (อินสแตนซ์ {{ $labels.instance }})
      คำอธิบาย: "mission-gsl pod ไม่ทำงานนานกว่า 5 นาที"

การปรับใช้นี้ได้รับการเริ่มต้นใหม่โดยอัตโนมัติตามกำหนดเวลาทุกๆ ชั่วโมง และหยุดทำงานเป็นเวลา 30 วินาทีในระหว่างกระบวนการ

ฉันคาดหวังว่าการแจ้งเตือนจะไม่เริ่มทำงาน เนื่องจากฉันกำหนดระยะเวลาหยุดทำงาน 5 นาที แต่มันก็เกิดขึ้น

ฉันพลาดอะไรไป

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา