Score:0

smartctl "องค์ประกอบในรายการข้อบกพร่องที่เพิ่มขึ้น" เทียบกับตัวควบคุม RAID "จำนวนข้อผิดพลาดของสื่อ"

ธง fr

ฉันใช้ฮาร์ดแวร์ Raid50 กับคอนโทรลเลอร์ PERC810 ในเซิร์ฟเวอร์ของฉัน และเพิ่งพบเมตริกที่ฉันไม่แน่ใจจนถึงตอนนี้ ฉันใช้เมตริก smartctl "องค์ประกอบในรายการข้อบกพร่องที่เพิ่มขึ้น" เป็นคำใบ้ว่าไดรฟ์ล้มเหลวและควรลบออก แต่ถ้าฉันใช้ perccli (หรือ storcli/megacli) ไดรฟ์จะแสดงเมตริกที่เรียกว่า "สื่อ นับข้อผิดพลาด" ปัญหาที่ฉันพบคือ จากสิ่งที่ฉันได้อ่านเกี่ยวกับเมตริกเหล่านี้ โดยพื้นฐานแล้วมันเหมือนกัน - ทั้งคู่แสดงเซกเตอร์ที่จัดสรรใหม่หรือข้อบกพร่องทางกายภาพบนดิสก์ แต่ hdds บางตัวของฉันแสดงตัวเลขที่มากกว่าศูนย์ที่ Elements ในรายการข้อบกพร่องที่เพิ่มขึ้น แต่มีค่าเป็นศูนย์ที่ Media error count และในทางกลับกัน .. ตัวอย่างเช่นดิสก์นี้:

perccli /c0/e37/s7 แสดงทั้งหมด
เวอร์ชัน CLI = 007.1327.0000.0000 27 กรกฎาคม 2020
ระบบปฏิบัติการ = Linux 4.19.0-0.bpo.9-amd64
คอนโทรลเลอร์ = 0
สถานะ = ความสำเร็จ
คำอธิบาย = แสดงข้อมูลไดรฟ์สำเร็จ


ไดรฟ์ /c0/e37/s7 :
================

--------------------------------------------- --------------------------
EID:Slt DID สถานะ DG ขนาด Intf Med SED PI SeSz Model Sp Type 
--------------------------------------------- --------------------------
37:7 72 Onln 1 3.637 TB SAS HDD NN 512B WD4001FYYG-01SL3 U -    
--------------------------------------------- --------------------------

EID=รหัสอุปกรณ์ช่องใส่|Slt=หมายเลขช่อง|DID=รหัสอุปกรณ์|DG=DriveGroup
DHS=อะไหล่สำรองเฉพาะ|UGood=สินค้าที่ไม่ได้กำหนดค่า|GHS=อะไหล่สำรองส่วนกลาง
UBad=ไม่ได้กำหนดค่าไม่ดี|Sntze=ฆ่าเชื้อ|Onln=ออนไลน์|Offln=ออฟไลน์|Intf=อินเทอร์เฟซ
Med=ประเภทสื่อ|SED=ไดรฟ์เข้ารหัสด้วยตนเอง|PI=ข้อมูลการป้องกัน
SeSz=ขนาดเซกเตอร์|Sp=ปั่น|U=ขึ้น|D=ลง|T=เปลี่ยนผ่าน|F=ต่างชาติ
UGUnsp=Uดี ไม่รองรับ|UGShld=Uดี ป้องกัน|HSPShld=Hotspare ป้องกัน
CFShld=กำหนดค่าป้องกัน|Cpybck=CopyBack|CBSHld=Cybback ป้องกัน
UBUnsp=ไม่สนับสนุน UBad|Rbld=สร้างใหม่


ไดรฟ์ /c0/e37/s7 - ข้อมูลโดยละเอียด :
=======================================

ไดรฟ์ /c0/e37/s7 สถานะ :
======================
โล่เคาน์เตอร์ = 0
จำนวนข้อผิดพลาดของสื่อ = 38
จำนวนข้อผิดพลาดอื่นๆ = 118063
อุณหภูมิไดรฟ์ = 41C (105.80 F)
จำนวนความล้มเหลวในการทำนาย = 0
การแจ้งเตือน S.M.A.R.T ตั้งค่าสถานะโดยไดรฟ์ = ไม่


คุณลักษณะอุปกรณ์ไดรฟ์ /c0/e37/s7 :
==================================
SN = WMC1F0D41KD5
รหัสผู้ผลิต = WD      
หมายเลขรุ่น = WD4001FYYG-01SL3
ผู้จำหน่าย NAND = NA
WWN = 50000C0F01F55DD1
การแก้ไขเฟิร์มแวร์ = VR08
หมายเลขเผยแพร่เฟิร์มแวร์ = N/A
ขนาดดิบ = 3.638 TB [0x1d1c0beb0 ภาคส่วน]
ขนาดบังคับ = 3.637 TB [0x1d1b00000 ภาคส่วน]
ขนาดที่ไม่ถูกบังคับ = 3.637 TB [0x1d1b0beb0 ภาคส่วน]
ความเร็วของอุปกรณ์ = 6.0Gb/s
ความเร็วลิงค์ = 6.0Gb/s
เขียนแคช = N/A
ขนาดเซกเตอร์ตรรกะ = 512B
ขนาดภาคกายภาพ = 512B
ชื่อตัวเชื่อมต่อ = 01

ซึ่งแสดงให้เห็นว่า จำนวนข้อผิดพลาดของสื่อ = 3แต่เมื่อฉันใช้ smartctl สำหรับดิสก์เดียวกัน:

smartctl -a -d megaraid,72 /dev/sdg
smartctl 7.2 2020-12-30 r5155 [x86_64-linux-4.19.0-0.bpo.9-amd64] (รุ่นในเครื่อง)
ลิขสิทธิ์ (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

=== จุดเริ่มต้นของส่วนข้อมูล ===
ผู้จำหน่าย: WD
สินค้า: WD4001FYYG-01SL3
การแก้ไข: VR08
การปฏิบัติตาม: SPC-4
ความจุของผู้ใช้: 4,000,787,030,016 ไบต์ [4.00 TB]
ขนาดบล็อกตรรกะ: 512 ไบต์
อัตราการหมุน: 7200 รอบต่อนาที
ฟอร์มแฟคเตอร์: 3.5 นิ้ว
รหัสหน่วยตรรกะ: 0x50000c0f01f55dd0
หมายเลขซีเรียล: WMC1F0D41KD5
ประเภทอุปกรณ์: ดิสก์
โปรโตคอลการขนส่ง: SAS (SPL-3)
เวลาท้องถิ่นคือ: วันศุกร์ที่ 28 มกราคม 14:14:51 2022 CET
การสนับสนุน SMART คือ: พร้อมใช้งาน - อุปกรณ์มีความสามารถ SMART
การสนับสนุน SMART คือ: เปิดใช้งาน
คำเตือนอุณหภูมิ: เปิดใช้งาน

=== จุดเริ่มต้นของการอ่านข้อมูลสมาร์ทส่วน ===
สถานะสุขภาพสมาร์ท: ตกลง

อุณหภูมิไดรฟ์ปัจจุบัน: 41 C
อุณหภูมิการเดินทางของไดรฟ์: 40 C

กำลังสะสมตรงเวลา ชั่วโมง:นาที 60298:10
ผลิตสัปดาห์ที่ 46 ปี 2014
จำนวนรอบที่ระบุตลอดอายุการใช้งานอุปกรณ์: 1048576
รอบสตาร์ท-สต๊อปสะสม: 18
จำนวนการขนถ่ายที่ระบุตลอดอายุการใช้งานอุปกรณ์: 1114112
รอบการขนถ่ายสะสม: 118
องค์ประกอบในรายการข้อบกพร่องที่เพิ่มขึ้น: 0

บันทึกตัวนับข้อผิดพลาด:
           แก้ไขข้อผิดพลาดโดย Total Correction Gigabytes Total
               อัลกอริทึมอ่านซ้ำ/ข้อผิดพลาด ECC ประมวลผลโดยไม่ได้แก้ไข
           รวดเร็ว | การเขียนซ้ำที่ล่าช้าแก้ไขข้อผิดพลาดการเรียกใช้ [10^9 ไบต์]
อ่าน: 2538437 9298 76289 2547735 9392 215124.761 94
เขียน: 5550372 5405661 5407707 10956033 5405661 571404.363 0
ตรวจสอบ: 184 0 0 184 0 352.277 0

จำนวนข้อผิดพลาดที่ไม่ใช่ปานกลาง: 202249

บันทึกการทดสอบตัวเอง SMART
จำนวนกลุ่มสถานะการทดสอบ LifeTime LBA_first_err [SK ASC ASQ]
     หมายเลขรายละเอียด (ชั่วโมง)
# 1 พื้นหลังยาวเสร็จสมบูรณ์ - 11 - [- - -]

ระยะเวลาการทดสอบตัวเองแบบยาว (ขยาย): 31120 วินาที [518.7 นาที]

มันแสดงให้เห็น องค์ประกอบในรายการข้อบกพร่องที่เพิ่มขึ้น: 0

นี่เป็นอีกตัวอย่างหนึ่งบนเซิร์ฟเวอร์เดียวกัน ต่างกันแค่ hdd:

perccli /c0/e37/s4 แสดงทั้งหมด
เวอร์ชัน CLI = 007.1327.0000.0000 27 กรกฎาคม 2020
ระบบปฏิบัติการ = Linux 4.19.0-0.bpo.9-amd64
คอนโทรลเลอร์ = 0
สถานะ = ความสำเร็จ
คำอธิบาย = แสดงข้อมูลไดรฟ์สำเร็จ


ไดรฟ์ /c0/e37/s4 :
================

--------------------------------------------- --------------------------
EID:Slt DID สถานะ DG ขนาด Intf Med SED PI SeSz Model Sp Type 
--------------------------------------------- --------------------------
37:4 63 Onln 1 3.637 TB SAS HDD NN 512B WD4001FYYG-01SL3 U -    
--------------------------------------------- --------------------------

EID=รหัสอุปกรณ์ช่องใส่|Slt=หมายเลขช่อง|DID=รหัสอุปกรณ์|DG=DriveGroup
DHS=อะไหล่สำรองเฉพาะ|UGood=สินค้าที่ไม่ได้กำหนดค่า|GHS=อะไหล่สำรองส่วนกลาง
UBad=ไม่ได้กำหนดค่าไม่ดี|Sntze=ฆ่าเชื้อ|Onln=ออนไลน์|Offln=ออฟไลน์|Intf=อินเทอร์เฟซ
Med=ประเภทสื่อ|SED=ไดรฟ์เข้ารหัสด้วยตนเอง|PI=ข้อมูลการป้องกัน
SeSz=ขนาดเซกเตอร์|Sp=ปั่น|U=ขึ้น|D=ลง|T=เปลี่ยนผ่าน|F=ต่างชาติ
UGUnsp=Uดี ไม่รองรับ|UGShld=Uดี ป้องกัน|HSPShld=Hotspare ป้องกัน
CFShld=กำหนดค่าป้องกัน|Cpybck=CopyBack|CBSHld=Cybback ป้องกัน
UBUnsp=ไม่สนับสนุน UBad|Rbld=สร้างใหม่


ไดรฟ์ /c0/e37/s4 - ข้อมูลโดยละเอียด :
=======================================

สถานะไดรฟ์ /c0/e37/s4 :
======================
โล่เคาน์เตอร์ = 0
จำนวนข้อผิดพลาดของสื่อ = 0
จำนวนข้อผิดพลาดอื่นๆ = 118060
อุณหภูมิไดรฟ์ = 35C (95.00 F)
จำนวนความล้มเหลวในการทำนาย = 0
การแจ้งเตือน S.M.A.R.T ตั้งค่าสถานะโดยไดรฟ์ = ไม่


คุณลักษณะอุปกรณ์ไดรฟ์ /c0/e37/s4 :
==================================
SN = WMC1F0D222KF
รหัสผู้ผลิต = WD      
หมายเลขรุ่น = WD4001FYYG-01SL3
ผู้จำหน่าย NAND = NA
WWN = 50000C0F01352C35
การแก้ไขเฟิร์มแวร์ = VR08
หมายเลขเผยแพร่เฟิร์มแวร์ = N/A
ขนาดดิบ = 3.638 TB [0x1d1c0beb0 ภาคส่วน]
ขนาดบังคับ = 3.637 TB [0x1d1b00000 ภาคส่วน]
ขนาดที่ไม่ถูกบังคับ = 3.637 TB [0x1d1b0beb0 ภาคส่วน]
ความเร็วของอุปกรณ์ = 6.0Gb/s
ความเร็วลิงค์ = 6.0Gb/s
เขียนแคช = N/A
ขนาดเซกเตอร์ตรรกะ = 512B
ขนาดภาคกายภาพ = 512B
ชื่อตัวเชื่อมต่อ = 01 


ไดรฟ์ /c0/e37/s4 นโยบาย/การตั้งค่า :
==================================
ตำแหน่งไดรฟ์ = DriveGroup:1, Span:1, แถว:0
ตำแหน่งตู้ = 0
หมายเลขพอร์ตที่เชื่อมต่อ = 0 (path0) 
หมายเลขลำดับ = 2
อะไหล่สำรอง = No
อะไหล่ฉุกเฉิน = ไม่
หมายเลขลำดับเหตุการณ์ความล้มเหลวของการคาดการณ์ล่าสุด = 0
การวินิจฉัยเสร็จสิ้นในวันที่ = N/A
ประเภท FDE = ไม่มี
ความสามารถ SED = ไม่
เปิดใช้งาน SED = ไม่
ปลอดภัย = ไม่
Cryptographic Erase Capable = ไม่
สนับสนุนการฆ่าเชื้อ = ไม่สนับสนุน
ล็อค = ไม่
ต้องการความสนใจ EKM = ไม่
PI ที่มีสิทธิ์ = ไม่
ได้รับการรับรอง = เลขที่
ความสามารถพอร์ตกว้าง = ไม่

ข้อมูลท่าเรือ :
================

-----------------------------------------
สถานะพอร์ต ที่อยู่ Linkspeed SAS        
-----------------------------------------
   0 ใช้งาน 6.0Gb/s 0x50000c0f01352c36 
   1 ใช้งานอยู่ ไม่ทราบ 0x0                
-----------------------------------------


สอบถามข้อมูล = 
00 00 06 12 5b 01 10 02 57 44 20 20 20 20 20 20 
57 44 34 30 30 31 46 59 59 47 2d 30 31 53 4c 33 
56 52 30 38 57 44 2d 57 4d 43 31 46 30 44 32 32 
32 4b 46 20 20 20 20 20 00 00 00 a0 0c 40 20 c0 
04 60 04 c0 00 00 00 00 00 00 00 00 00 00 00 00 
00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 
00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 
00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 

ที่ไหน จำนวนข้อผิดพลาดของสื่อ = 0แต่ smartctl:

smartctl -a -d megaraid,63 /dev/sdg
smartctl 7.2 2020-12-30 r5155 [x86_64-linux-4.19.0-0.bpo.9-amd64] (รุ่นในเครื่อง)
ลิขสิทธิ์ (C) 2002-20, Bruce Allen, Christian Franke, www.smartmontools.org

=== จุดเริ่มต้นของส่วนข้อมูล ===
ผู้จำหน่าย: WD
สินค้า: WD4001FYYG-01SL3
การแก้ไข: VR08
การปฏิบัติตาม: SPC-4
ความจุของผู้ใช้: 4,000,787,030,016 ไบต์ [4.00 TB]
ขนาดบล็อกตรรกะ: 512 ไบต์
อัตราการหมุน: 7200 รอบต่อนาที
ฟอร์มแฟคเตอร์: 3.5 นิ้ว
รหัสหน่วยตรรกะ: 0x50000c0f01352c34
หมายเลขซีเรียล: WMC1F0D222KF
ประเภทอุปกรณ์: ดิสก์
โปรโตคอลการขนส่ง: SAS (SPL-3)
เวลาท้องถิ่นคือ: วันศุกร์ที่ 28 มกราคม 14:39:52 น. 2022 CET
การสนับสนุน SMART คือ: พร้อมใช้งาน - อุปกรณ์มีความสามารถ SMART
การสนับสนุน SMART คือ: เปิดใช้งาน
คำเตือนอุณหภูมิ: เปิดใช้งาน

=== จุดเริ่มต้นของการอ่านข้อมูลสมาร์ทส่วน ===
สถานะสุขภาพสมาร์ท: ตกลง

อุณหภูมิไดรฟ์ปัจจุบัน: 35 C
อุณหภูมิการเดินทางของไดรฟ์: 40 C

กำลังสะสมตรงเวลา ชั่วโมง:นาที 60299:24
ผลิตสัปดาห์ที่ 46 ปี 2014
จำนวนรอบที่ระบุตลอดอายุการใช้งานอุปกรณ์: 1048576
รอบสตาร์ท-สต๊อปสะสม: 18
จำนวนการขนถ่ายที่ระบุตลอดอายุการใช้งานอุปกรณ์: 1114112
รอบการขนถ่ายสะสม: 118
องค์ประกอบในรายการข้อบกพร่องที่เพิ่มขึ้น: 44

บันทึกตัวนับข้อผิดพลาด:
           แก้ไขข้อผิดพลาดโดย Total Correction Gigabytes Total
               อัลกอริทึมอ่านซ้ำ/ข้อผิดพลาด ECC ประมวลผลโดยไม่ได้แก้ไข
           รวดเร็ว | การเขียนซ้ำที่ล่าช้าแก้ไขข้อผิดพลาดการเรียกใช้ [10^9 ไบต์]
อ่าน: 4899063 1 1 4899064 1 215489.217 0
เขียน: 6593514 494 496 6594008 499 571584.348 0
ตรวจสอบ: 345 0 0 345 0 349.197 0

จำนวนข้อผิดพลาดที่ไม่ใช่ปานกลาง: 202287

บันทึกการทดสอบตัวเอง SMART
จำนวนกลุ่มสถานะการทดสอบ LifeTime LBA_first_err [SK ASC ASQ]
     หมายเลขรายละเอียด (ชั่วโมง)
# 1 พื้นหลังยาวเสร็จสมบูรณ์ - 11 - [- - -]

ระยะเวลาการทดสอบตัวเองแบบยาว (ขยาย): 31120 วินาที [518.7 นาที]

การแสดง องค์ประกอบในรายการข้อบกพร่องที่เพิ่มขึ้น: 44

คุณช่วยอธิบายความแตกต่างระหว่างเมตริกทั้งสองนี้และเมตริกใดในการพิจารณาไดรฟ์ที่ผิดพลาด ขอขอบคุณ.

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา