Score:0

ข้อผิดพลาดของฮาร์ดแวร์ใน CPU หรือ RAM จะทำอย่างไร?

ธง cn

ฉันมีเซิร์ฟเวอร์ที่รายงานข้อผิดพลาดของฮาร์ดแวร์ไปยังระบบปฏิบัติการเป็นระยะๆ แต่อย่างอื่นจะทำงานโดยไม่มีปัญหาที่สังเกตเห็นได้

วันนี้ฉันพบสิ่งนี้ขณะเดินผ่านจอมอนิเตอร์ที่ติดอยู่กับมันป้อนคำอธิบายรูปภาพที่นี่

ใครช่วยบอกฉันทีว่ามันหมายถึงอะไร? นี่เป็นสิ่งที่ฉันต้องกังวลหรือไม่? มีไฟล์บันทึกที่ฉันสามารถเจาะลึกลงไปได้หรือไม่ เมื่อหลายสัปดาห์ก่อน ฉันสังเกตเห็นว่าระบบตรวจไม่พบแท่ง RAM หนึ่งแท่ง มันรายงานเพียง 112 GB แทนที่จะเป็น 128 GB ตอนนี้มันแสดงอย่างถูกต้องแม้ว่า

สำหรับข้อมูลเพิ่มเติม เซิร์ฟเวอร์นี้มีองค์ประกอบหลักดังต่อไปนี้:

  • ซุปเปอร์ไมโคร MBD-H11DSi-NT-B
  • 2x เอเอ็มดี Epyc 7301
  • 128GB ของ Kingston Server Premier KSM26RD8/16HAI DDR4-2666 regECC
  • Unraid เป็น OS
Score:5
ธง cn

ใครช่วยบอกฉันทีว่ามันหมายถึงอะไร?

คุณมีปัญหาเกี่ยวกับฮาร์ดแวร์ที่ต้องแก้ไข - น่าจะเป็นหน่วยความจำ พิมพ์ MC15_STATUS[มากกว่า|CE ใน google, ตีสองมาจาก ฟอรั่ม unraid ที่อาจเป็นประโยชน์แก่ข้าพเจ้าด้วย.

นี่เป็นสิ่งที่ฉันต้องกังวลหรือไม่?

อย่างแน่นอน! ละเว้นข้อผิดพลาดของฮาร์ดแวร์ที่อันตราย (ข้อมูล) ของคุณ ฉันจะหยุดการผลิตระบบนั้นโดยไม่ต้องเสียเวลาถามอินเทอร์เน็ตว่านี่เป็นปัญหาที่ฉันต้องกังวลหรือไม่

ใช้บางอย่างเช่น memtest86 เพื่อทดสอบและวินิจฉัยตำแหน่งของปัญหา

cn flag
ไม่มีเซิร์ฟเวอร์ "การผลิต" อื่นใด ใช่แล้ว ต้องรอจนถึงหลังคริสต์มาส จนกว่าฉันจะปิดมันและทำการทดสอบได้
Score:3
ธง za

ในกรณีของคุณ ฉันจะอ่านบันทึกเหตุการณ์ IPMI BMC เช่น กับ ipmiutil เซล. มันควรจะแสดงรายละเอียดเกี่ยวกับข้อผิดพลาด ในกรณีของฉัน มันแสดงให้เห็นแม้แต่ตำแหน่งสล็อตหน่วยความจำเฉพาะที่มีโมดูลที่ผิดพลาดอยู่

cn flag
ฉันมีเพียง IPMITool ซึ่งสำหรับฉันแล้ว ไม่แสดงรายการเหตุการณ์ที่เกี่ยวข้องกับหน่วยความจำ
Nikita Kipriyanov avatar
za flag
มี IPMITool จากเว็บไซต์ Supermicro ซึ่งมีคุณสมบัติต่ำกว่ามาตรฐานมาก น่าเสียดายที่ไม่รู้วิธีเชื่อมต่อกับ *local* IPMI BMC ผ่าน SMBusนอกจากนี้ยังมี [แพ็คเกจ `ipmitool`](https://github.com/ipmitool/ipmitool) ซึ่งแปลข้อความบันทึกเหตุการณ์ไม่ถูกต้อง (ไม่ได้ถอดรหัสทั้งหมดหรือแม้แต่ถอดรหัสผิด) ข้อมูลที่ถูกต้องที่สุดเกี่ยวกับ PSU และเหตุการณ์ความสมบูรณ์ของฮาร์ดแวร์อื่นๆ ที่ฉันหาได้จาก [`ipmiutil`](http://ipmiutil.sourceforge.net/) เท่านั้น (แต่ฉันต้องยอมรับว่า ipmitool ใช้งานง่ายกว่า)

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา