ฉันต้องการตรวจสอบความสมบูรณ์ของ Seagate ST16000NM002G SAS HDD หลายตัวที่โฮสต์ในเซิร์ฟเวอร์ดิสก์ที่ใช้ CentOS 7 เท่าที่ฉันเข้าใจ ดิสก์ Seagate ไม่เปิดเผย S.M.A.R.T. แอตทริบิวต์เนื่องจากการตัดสินใจของผู้บริหารที่แม่นยำ (ดู หน้านี้) และบริษัทแนะนำให้ใช้ซอฟต์แวร์ SeaTool ซึ่งตามซอฟต์แวร์ดังกล่าวมีความน่าเชื่อถือมากกว่า S.M.A.R.T. น่าเศร้าที่ดูเหมือนว่า SeaTool เวอร์ชัน SSD เท่านั้นที่มีให้สำหรับ Linux (ดู หน้านี้).
เนื่องจากฉันบอกว่า Segate+Linux ควรเป็นกรณีทั่วไปในศูนย์ข้อมูลสมัยใหม่ ฉันค่อนข้างแน่ใจว่าต้องมีเครื่องมือตรวจสอบที่เชื่อถือได้สำหรับดิสก์ Seagate สำหรับ Linux ใครสามารถให้ข้อมูลเชิงลึกได้บ้าง
แก้ไข: นี่คือสิ่งที่ฉันได้รับจาก smartctl สำหรับดิสก์ Seagate:
$ sudo smartctl -A /dev/sda
smartctl 7.0 2018-12-30 r4883 [x86_64-linux-3.10.0-1160.53.1.el7.x86_64] (รุ่นในเครื่อง)
ลิขสิทธิ์ (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org
=== จุดเริ่มต้นของการอ่านข้อมูลสมาร์ทส่วน ===
อุณหภูมิไดรฟ์ปัจจุบัน: 33 C
อุณหภูมิการเดินทางของไดรฟ์: 60 C
ผลิตสัปดาห์ที่ 42 ปี 2020
จำนวนรอบที่ระบุตลอดอายุการใช้งานอุปกรณ์: 50,000
รอบเริ่มต้น-หยุดสะสม: 20
จำนวนการขนถ่ายที่ระบุตลอดอายุการใช้งานอุปกรณ์: 600000
รอบการขนถ่ายสะสม: 3324
องค์ประกอบในรายการข้อบกพร่องที่เพิ่มขึ้น: 0
ในขณะที่ Toshiba HDD บนเครื่องอื่น:
$ sudo smartctl -A /dev/sdb
smartctl 7.1 2020-04-05 r5049 [x86_64-linux-4.18.0-348.12.2.el8_5.x86_64] (รุ่นในเครื่อง)
ลิขสิทธิ์ (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org
=== จุดเริ่มต้นของการอ่านข้อมูลสมาร์ทส่วน ===
หมายเลขการแก้ไขโครงสร้างข้อมูลแอตทริบิวต์ SMART: 16
แอตทริบิวต์ SMART เฉพาะของผู้ขายที่มีเกณฑ์:
ID# ATTRIBUTE_NAME ค่าสถานะ ค่าสถานะ ประเภทที่แย่ที่สุด อัปเดตเมื่อ RAW_VALUE ล้มเหลว
1 Raw_Read_Error_Rate 0x000b 100 100 050 ผิดพลาดล่วงหน้าเสมอ - 0
2 ปริมาณงาน_ประสิทธิภาพ 0x0005 100 100 050 ออฟไลน์ล่วงหน้า - 0
3 Spin_Up_Time 0x0027 100 100 001 ก่อนล้มเหลวเสมอ - 7019
4 Start_Stop_Count 0x0032 100 100 000 Old_age เสมอ - 34
5 Reallocated_Sector_Ct 0x0033 100 100 050 ล้มเหลวล่วงหน้าเสมอ - 0
7 Seek_Error_Rate 0x000b 100 100 050 ผิดพลาดล่วงหน้าเสมอ - 0
8 Seek_Time_Performance 0x0005 100 100 050 ก่อนล้มเหลว ออฟไลน์ - 0
9 Power_On_Hours 0x0032 062 062 000 Old_age เสมอ - 15428
10 Spin_Retry_Count 0x0033 100 100 030 ผิดพลาดล่วงหน้าเสมอ - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age เสมอ - 34
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age เสมอ - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age เสมอ - 32
193 Load_Cycle_Count 0x0032 100 100 000 Old_age เสมอ - 39
194 Temperature_Celsius 0x0022 100 100 000 Old_age เสมอ - 31 (ต่ำสุด/สูงสุด 15/39)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age เสมอ - 0
197 Current_Pending_Sector 0x0032 100 100 000 Old_age เสมอ - 0
198 ออฟไลน์_แก้ไขไม่ได้ 0x0030 100 100 000 Old_age ออฟไลน์ - 0
199 UDMA_CRC_Error_Count 0x0032 200 253 000 Old_age เสมอ - 0
220 Disk_Shift 0x0002 100 100 000 Old_age เสมอ - 0
222 Loaded_Hours 0x0032 062 062 000 Old_age เสมอ - 15427
223 Load_Retry_Count 0x0032 100 100 000 Old_age เสมอ - 0
224 Load_Friction 0x0022 100 100 000 Old_age เสมอ - 0
226 Load-in_Time 0x0026 100 100 000 Old_age เสมอ - 648
240 Head_Flying_Hours 0x0001 100 100 001 Pre-fail ออฟไลน์ - 0
ฉันคาดหวังบางอย่างเช่นหลังเพื่อให้สามารถตั้งค่าการตรวจสอบที่เหมาะสม (แม้ว่าจะไม่ถูกต้องหรือเชื่อถือได้)