ฉันกำลังตรวจสอบเซิร์ฟเวอร์หลายร้อยเครื่องทั้งเฉพาะและเสมือนโดยใช้สคริปต์ต่อไปนี้:
#!/bin/bash
PATH=/usr/lib64/ccache:/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin:/root/bin
เกณฑ์ = 90
serverip=$($(ซึ่ง ifconfig) | grep -Eo 'inet (addr:)?([0-9]*\.){3}[0-9]*' | grep -Eo '([0-9 ]*\.){3}[0-9]*' | grep -v '127.0.0.1' | หัว -1)
memused=$(free | awk '/Mem/{printf("การใช้ RAM: %.2f%\n"), $3/$2*100}' | awk '{print $3}' | cut -d"" - f1)
ถ้า [ "$memused" -gt "$threshold" ]
แล้ว
CTIME=$(วันที่ +%Y-%m-%d-%H%M%S)
ps aux > /root/.example/logs/lowmem-"${CTIME}"-ps.log
ด้านบน -n 1 -o %MEM -c > /root/.example/logs/lowmem-"${CTIME}"-top.log
ฟรี -m > /root/.example/logs/lowmem-"${CTIME}"-free.log
mysqladmin proc -v สถานะ > /root/.example/logs/lowmem-"${CTIME}"-mysqlproc.log
bash /example/general/slack.sh "#server-alerts" ":warning: $(ชื่อโฮสต์) - ${serverip} - การใช้หน่วยความจำถึง 90% - ตรวจสอบบันทึก /root/.example/logs/lowmem-${ CTIME} \n \`\`\`$(หัว -1 /root/.example/logs/lowmem-"${CTIME}"-free.log) \n $(หัว -2 /root/.example/logs /lowmem-"${CTIME}"-free.log | tail -1) \n $(tail -1 /root/.example/logs/lowmem-"${CTIME}"-free.log)\`\` \`"
crontab -l | grep -v '/example/mon_mem.sh' | crontab -
นอน 900
crontab -l | { แมว; echo "* * * * * ทุบตี /example/mon_mem.sh"; } | crontab -
ไฟ
ในขณะที่มันใช้งานได้ในกรณีส่วนใหญ่ เราสุ่มได้รับผลบวกปลอม เซิร์ฟเวอร์สุ่มอย่างสมบูรณ์และไม่สอดคล้องกับแต่ละเซิร์ฟเวอร์ ดังนั้นเซิร์ฟเวอร์หนึ่งอาจทริกเกอร์ แต่จากนั้นจะไม่ทริกเกอร์อีกเลย (เท็จ)
ตัวอย่างผลบวกลวง:
รวมใช้บัฟ/แคชที่ใช้ร่วมกันฟรี
เมม: 2048 345 1580 27 122 1674
สลับ: 2048 0 2048
มีการแจ้งเตือนเข้ามาจากเซิร์ฟเวอร์นี้ แต่คุณเห็นว่ามีการใช้งานเพียง 345 MB เท่านั้น