เซิร์ฟเวอร์ Ubuntu ของฉันปิดตัวเองในวันนี้และหลังจากดูที่ /var/log/kern.log
มันเป็นเพราะมันร้อนเกินไป:
8 ก.ย. 07:00:22 เคอร์เนลเซิร์ฟเวอร์ ipc2: [289498.255583] ระบบไฟล์ QNX4 0.2.3 ที่ลงทะเบียนแล้ว
10 ก.ย. 20:04:00 เคอร์เนลเซิร์ฟเวอร์ ipc2: [509336.574882] ความร้อน thermal_zone1: ถึงอุณหภูมิวิกฤต (100 C) กำลังปิด
10 ก.ย. 20:04:01 เคอร์เนลเซิร์ฟเวอร์ ipc2: [509337.601860] ความร้อน thermal_zone1: ถึงอุณหภูมิวิกฤต (100 C) กำลังปิด
สิ่งนี้ดูเหมือนจะดียกเว้นว่ามันเกิดขึ้นจากที่ไหนเลย มองไปที่ของฉัน ข้อมูลสุทธิ บันทึกแสดงให้เห็นว่ามันเปลี่ยนจาก 44° เซลเซียส t0 เป็น 70°° ภายใน 40 วินาที ณ จุดที่เซิร์ฟเวอร์ปิด (เส้นโค้งสีแดงที่ลาดลงจาก 70° เป็นช่วงเวลาที่เซิร์ฟเวอร์ปิดอยู่):
อย่างที่คุณเห็นมีเพียงเซ็นเซอร์สองตัวเท่านั้นที่รายงานการเปลี่ยนแปลงนี้ และการใช้งาน CPU อยู่ที่ 20% ก่อนปิดเซิร์ฟเวอร์:
ในภายหลัง คุณจะเห็นความร้อนที่เพิ่มขึ้นตามปกติจากการใช้งาน CPU ที่เพิ่มขึ้นเมื่อเซ็นเซอร์อุณหภูมิทั้งหมดรายงานว่ามีความร้อนเพิ่มขึ้น
นี่เป็นครั้งแรกที่สิ่งนี้เกิดขึ้นกับฉันและทำให้เกิดคำถามขึ้นมา
- มีบันทึกเพิ่มเติมใดที่ฉันสามารถใช้เพื่อตรวจสอบปัญหานี้เพื่อยืนยันว่าเป็นความล้มเหลวของฮาร์ดแวร์หรือความร้อนสูงเกินจริงหรือไม่
- เป็นเรื่องปกติหรือไม่ที่เซ็นเซอร์อุณหภูมิจะล้มเหลวเมื่อเวลาผ่านไป?
- สามารถเปลี่ยนได้หรือไม่หากเป็นกรณีนี้
- ฉันสามารถเปลี่ยนพฤติกรรมของ Ubuntu เพื่อปิดเซิร์ฟเวอร์ได้หรือไม่ หากเซ็นเซอร์อุณหภูมิทั้งหมดรายงานค่าที่สูง