Score:0

เซิร์ฟเวอร์ Linux nrpe nagios check_procs การตรวจสอบสถานะกระบวนการ - ต้องการข้อมูล เมื่อเริ่มกระบวนการใหม่

ธง mx

ฉันต้องได้รับแจ้งจาก นาจิโอ เมื่อกระบวนการบนเซิร์ฟเวอร์ระยะไกลเริ่มใหม่

สิ่งเดียวที่ฉันไม่รู้ว่าต้องทำอย่างไรคือตรวจสอบสถานะของกระบวนการ และจะทำอย่างไร

ฉันได้รับคำสั่ง nrpe นี้ในเซิร์ฟเวอร์ระยะไกล:  ./check_procs -c 1: -a "/usr/local/yyyprogram/sbin/XXXdaemon" -s Sl แต่กระบวนการนี้ต้องทำงานตลอดเวลา มีกลไกของตัวเองในการรีสตาร์ท และนี่คือสิ่งเดียวที่ฉันต้องรู้ - เมื่อไหร่ที่จะเริ่มใหม่ ฉันควรเพิ่มสถานะของกระบวนการใดที่นี่และตัวอย่าง -s SlRD เป็นอย่างไร หรือ -s Sl -s R -s D ตกลงไหม บางทีฉันอาจใช้วิธีอื่นเพื่อให้ได้ข้อมูลประเภทนี้: ตกลง|คำเตือน|ไม่รู้จัก|สำคัญ? สถานะเดียวที่ตกลงสำหรับฉันคือตกลง (หมายถึงกำลังทำงาน)

นอกจากนี้ วิธีตรวจสอบจากเซิร์ฟเวอร์ nagios อื่น ฉันควรตรวจสอบทุก ๆ วินาทีหรือไม่ เมื่อบริการเริ่มใหม่ ฉันจะได้รับแจ้งหนึ่งหรือสองนาทีต่อมา แต่จะรู้ได้อย่างไรว่าเกิดขึ้นโดยไม่ตรวจสอบบันทึก PID ของบริการนี้หลังจากกลไกการรีสตาร์ทแตกต่างจากเมื่อก่อน

ฉันจะแน่ใจได้อย่างไรว่าสถานะทั้งหมดรวมอยู่ในบรรทัดของการกำหนดค่าคำสั่ง nrpe

กรุณาช่วย:)

แก้ไข

root@server:/usr/local/nagios/libexec# ./check_procs -vv -a "/usr/local/yyyprogram/sbin/xxxdaemon"
CMD: /usr/bin/ps axwwo 'stat uid pid ppid vsz rss pcpu cgroup:256 comm args'
ตรงกัน: uid=0 vsz=9412 rss=2804 pid=517515 ppid=1 jid=0 pcpu=0.20 stat=Sl etime= prog=xxxdaemon args=/usr/local/yyyprogram/sbin/xxxdaemon -d /usr/local/ yyyprogram/conf -b
 cgroup_hierarchy=(โมฆะ)
Score:0
ธง cn

ก่อนอื่น หากคุณสนใจว่ากระบวนการทำงานมานานแค่ไหน ตรวจสอบ_procs ไม่มีฟังก์ชันนั้นเท่าที่ฉันเห็นจาก -ชม ธง ดังนั้นฉันไม่แน่ใจว่าทำไมคุณถึงคิดว่าเป็นเช่นนั้น หรือนั่นไม่ใช่สิ่งที่คุณกำลังพยายามตรวจสอบ

หากคุณต้องการตรวจสอบว่ากระบวนการทำงานมานานแค่ไหน คุณไม่จำเป็นต้องใช้ปลั๊กอินสำหรับกระบวนการนั้น ตัวอย่างนี้คว้า PID ของ netdata ให้คุณ ครั้ง, greps เพื่อแสดงจำนวนและการใช้งานเท่านั้น xargs เพื่อลบช่องว่างรอบ ๆ หมายเลข:

$ ps -p $(pidof /usr/sbin/netdata) -o etimes | grep -E "[1-9].*" | xargs
65805

$ systemctl รีสตาร์ท netdata

$ ps -p $(pidof /usr/sbin/netdata) -o etimes | grep -E "[1-9].*" | xargs
10

สิ่งที่คุณต้องทำคือเขียนเชลล์สคริปต์ที่จะตรวจสอบว่าค่าต่ำกว่าตัวเลขที่กำหนดหรือไม่ หากมีปัญหา ทางออก 1จากนั้นเรียกใช้สคริปต์นั้นผ่าน NRPE จาก Nagios

Kamil Bu avatar
mx flag
ไม่ ฉันไม่ต้องการข้อมูลว่ามันรันนิงมานานแค่ไหนแล้ว ฉันจำเป็นต้องรู้และได้รับแจ้งจาก nagios ว่ารีสตาร์ทแล้ว และฉันไม่รู้ว่าฉันควรตรวจสอบแฟล็กใดและวิธีรับข้อมูลนี้
pzkpfw avatar
cn flag
การตรวจสอบเวลาจะบอกคุณว่าได้เริ่มใหม่แล้วหรือยัง และฉันเพิ่งบอกวิธีตรวจสอบให้คุณทราบ สิ่งนี้ไม่ตอบคำถามของคุณในทางใด คุณได้ลองทำอะไรไปแล้วบ้าง?

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา