ฉันมีเซิร์ฟเวอร์ Ubuntu ที่ทำงานจากระยะไกลในสำนักงานอื่น มันตายไปสองสามครั้งและฉันไม่สามารถหาสาเหตุได้ เป็นเซิร์ฟเวอร์ที่ร้องขอบริการภายนอกผ่าน API โดย ตาย
ฉันหมายความว่ามันยังคงทำงานอยู่ แต่เพิ่งหยุดทำงาน ดูเหมือนว่าเครือข่ายของเซิร์ฟเวอร์จะออฟไลน์ด้วยและการสแกน LAN ไม่พบ
อยู่เบื้องหลังเราเตอร์สำนักงานและเรียกใช้เคอร์เนล 18.04 4.15.0-147-generic ไม่มีใครในไซต์มีบัญชีบนเซิร์ฟเวอร์นี้
นี่คือสิ่งที่ฉันได้ลอง
รีบูตครั้งล่าสุด
ผลลัพธ์:
รีบูตระบบ บูต 4.15.0-151-gener พฤ. ก.ค. 22 14:49 ยังคงทำงานอยู่
รีบูตระบบ บูต 4.15.0-147-gener วันพุธที่ 21 กรกฎาคม 15:48 ยังคงทำงานอยู่
รีบูตระบบ บูต 4.15.0-147-gener พุธ 21 ก.ค. 14:05 - 15:48 (01:43 น.)
รีบูตระบบ บูต 4.15.0-147-gener ส. 17 ก.ค. 18:24 - 15:48 (3+21:24)
รีบูตระบบ บูต 4.15.0-147-gener พฤ ก.ค. 58 17:26 - 15:48 (5+22:22)
22 ก.ค. 14:49 น
เป็นการรีบูตที่ฉันขอให้พนักงานในสถานที่ทำ ไฟฟ้าดับเมื่อวันที่ 21 ก.ค.
- /var/log/syslog
22 ก.ค. 09:08:50 localhost service_start.sh[946]: INFO:launcher:myjob จบการส่งออกสำหรับ 2
22 ก.ค. 09:08:50 localhost service_start.sh[946]: INFO:launcJul 22 14:50:05 localhost systemd[1]: การเริ่มต้น Flush Journal ไปยังที่เก็บข้อมูลถาวร ...
22 ก.ค. 14:50:05 localhost systemd [1]: เริ่มต้นภูตข้อมูลเมตา LVM2
22 กรกฎาคม 14:50:05 localhost systemd [1]: เริ่มโหลด / บันทึก Random Seed
22 ก.ค. 14:50:05 localhost lvm[443]: 2 โลจิคัลวอลุ่มในกลุ่มวอลุ่ม "localhost-vg" ถูกมอนิเตอร์
22 ก.ค. 14:50:05 localhost systemd[1]: เริ่มแล้ว ตั้งค่าเค้าโครงแป้นพิมพ์คอนโซล
22 ก.ค. 14:50:05 localhost systemd-modules-load[436]: โมดูลที่แทรก 'iscsi_tcp'
ระบบออฟไลน์หลังจากนั้น 22 ก.ค. 09:08:50 น
. 22 ก.ค. 14:50:05 น
เป็นการรีบูตที่กล่าวถึงก่อนหน้านี้
ดูเหมือนว่าระบบไม่ได้รีบูตหรือปิดระบบ มิฉะนั้นควรมีบันทึกบางอย่างระบุไว้ และไม่มีบันทึกข้อผิดพลาดของระบบใน syslog เช่นกัน
มีการตั้งค่างาน cron ของผู้ใช้สองรายการให้ทำงานทุก ๆ 5 และ 10 นาทีและมีรายการเรียกใช้ cron ใน syslog 22 ก.ค. 09:05:01น
ก่อนที่ระบบจะล่ม 22 ก.ค. 09:08:50 น
.
ไม่มีบุคลากรด้านเทคนิคในสถานที่ทำงาน และฉันสามารถเข้าถึงเซิร์ฟเวอร์ผ่าน teamview จากคอมพิวเตอร์ในสถานที่อื่นได้ในขณะนี้
ฉันเรียกใช้ htop และโหลดของระบบเบา
ตอนนี้ฉันกำลังสูญเสีย ฉันควรตรวจสอบอะไรอีกบ้างระหว่างเซสชันการดูแบบทีมครั้งต่อไป