ฉันมีไดรฟ์ WD (3TB) ต่อไปนี้ที่ทำให้ฉันมีปัญหา (ฉันไม่สามารถเข้าถึงไฟล์ใดๆ ได้: แม้แต่ ล
คำสั่งนั้นทำให้เกิดการรอคอยที่ไม่มีวันสิ้นสุด)
นี่คือรายละเอียดบางอย่างบนดิสก์:
ดิสก์ /dev/sda: 2.7 TiB, 3000592982016 ไบต์, 5860533168 ภาคส่วน
รุ่นดิสก์: EZRX-00D8PB0
หน่วย: ภาค 1 * 512 = 512 ไบต์
ขนาดเซกเตอร์ (โลจิคัล/กายภาพ): 512 ไบต์ / 4096 ไบต์
ขนาด I/O (ต่ำสุด/เหมาะสม): 4096 ไบต์ / 4096 ไบต์
ประเภทป้ายชื่อดิสก์: gpt
ประเภทขนาดเซกเตอร์สิ้นสุดการเริ่มต้นของอุปกรณ์
/dev/sda1 2048 5860532223 5860530176 ระบบไฟล์ Linux 2.7T
หลังจากปัญหานี้ ฉันทำการทดสอบเพื่อค้นหาว่าปัญหาประเภทใดที่ส่งผลกระทบต่อมัน
ในขั้นตอนแรกฉันทำการทดสอบสั้น ๆ sudo smartctl -t สั้น /dev/sda
ที่แสดงข้อผิดพลาดต่อไปนี้ให้ฉันเห็น:
=== จุดเริ่มต้นของการอ่านข้อมูลสมาร์ทส่วน ===
การแก้ไขโครงสร้างบันทึกการทดสอบตัวเอง SMART หมายเลข 1
จำนวน Test_Description สถานะอายุการใช้งานที่เหลืออยู่ (ชั่วโมง) LBA_of_first_error
# 1 สั้นออฟไลน์ เสร็จสมบูรณ์: อ่านล้มเหลว 90% 17480 8467144
จากนั้นฉันพยายามรับคุณสมบัติบางอย่างตามที่อธิบายไว้ในโพสต์อื่นนี้ ทำความเข้าใจกับ smartctl -a เอาต์พุต โดยใช้ sudo smartctl -a /dev/sda
. คุณจะพบตารางแอตทริบิวต์และบันทึกข้อผิดพลาดล่าสุด 5 รายการได้ที่นี่
หมายเลขการแก้ไขโครงสร้างข้อมูลแอตทริบิวต์ SMART: 16
แอตทริบิวต์ SMART เฉพาะของผู้ขายที่มีเกณฑ์:
ID# ATTRIBUTE_NAME ค่าสถานะ ค่าสถานะ ประเภทที่แย่ที่สุด อัปเดตเมื่อ RAW_VALUE ล้มเหลว
1 Raw_Read_Error_Rate 0x002f 200 200 051 ผิดพลาดล่วงหน้าเสมอ - 71
3 Spin_Up_Time 0x0027 174 161 021 ก่อนล้มเหลวเสมอ - 6266
4 Start_Stop_Count 0x0032 100 100 000 Old_age เสมอ - 695
5 Reallocated_Sector_Ct 0x0033 200 200 140 ล้มเหลวล่วงหน้าเสมอ - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age เสมอ - 0
9 Power_On_Hours 0x0032 077 077 000 Old_age เสมอ - 17481
10 Spin_Retry_Count 0x0032 100 100 000 Old_age เสมอ - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age เสมอ - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age เสมอ - 457
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age เสมอ - 63
193 Load_Cycle_Count 0x0032 179 179 000 Old_age เสมอ - 64193
194 อุณหภูมิ_เซลเซียส 0x0022 122 101 000 Old_age เสมอ - 28
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age เสมอ - 0
197 Current_Pending_Sector 0x0032 200 197 000 Old_age เสมอ - 356
198 ออฟไลน์_แก้ไขไม่ได้ 0x0030 197 197 000 Old_age ออฟไลน์ - 1691
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age เสมอ - 0
200 Multi_Zone_Error_Rate 0x0008 196 196 000 Old_age ออฟไลน์ - 1691
เวอร์ชันบันทึกข้อผิดพลาด SMART: 1
จำนวนข้อผิดพลาด ATA: 47 (บันทึกอุปกรณ์มีข้อผิดพลาดห้ารายการล่าสุดเท่านั้น)
CR = การลงทะเบียนคำสั่ง [HEX]
FR = คุณสมบัติลงทะเบียน [HEX]
SC = ทะเบียนนับภาค [HEX]
SN = ลงทะเบียนหมายเลขเซกเตอร์ [HEX]
CL = การลงทะเบียนกระบอกสูบต่ำ [HEX]
CH = ทะเบียนทรงกระบอกสูง [HEX]
DH = ทะเบียนอุปกรณ์/ส่วนหัว [HEX]
DC = การลงทะเบียนคำสั่งอุปกรณ์ [HEX]
ER = ข้อผิดพลาดในการลงทะเบียน [HEX]
ST = การลงทะเบียนสถานะ [HEX]
Powered_Up_Time วัดจากการเปิดเครื่อง และพิมพ์เป็น
DDd+hh:mm:SS.sss โดยที่ DD=วัน, hh=ชั่วโมง, mm=นาที
SS=วินาที และ sss=มิลลิวินาที มัน "ห่อ" หลังจาก 49.710 วัน
เกิดข้อผิดพลาด 47 เมื่อเปิดดิสก์ตลอดอายุการใช้งาน: 232 ชั่วโมง (9 วัน + 16 ชั่วโมง)
เมื่อคำสั่งที่ทำให้เกิดข้อผิดพลาดเกิดขึ้น อุปกรณ์ทำงานอยู่หรือไม่ได้ใช้งาน
หลังจากเสร็จสิ้นคำสั่ง รีจิสเตอร์คือ:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 61 0a 00 00 00 00
คำสั่งที่นำไปสู่คำสั่งที่ทำให้เกิดข้อผิดพลาดคือ:
CR FR SC SN CL CH DH DC Powered_Up_Time คำสั่ง/คุณลักษณะ_ชื่อ
-- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- ------------------ ------------------ --
e0 00 0a 00 00 00 00 00 04:00:17.522 สแตนด์บายทันที
ef 03 46 00 00 00 a0 00 04:00:16.815 คุณสมบัติการตั้งค่า [ตั้งค่าโหมดการถ่ายโอน]
ec 00 00 00 00 00 a0 00 04:00:16.815 อุปกรณ์ระบุตัวตน
เกิดข้อผิดพลาด 46 เมื่อเปิดดิสก์ตลอดอายุการใช้งาน: 232 ชั่วโมง (9 วัน + 16 ชั่วโมง)
เมื่อคำสั่งที่ทำให้เกิดข้อผิดพลาดเกิดขึ้น อุปกรณ์ทำงานอยู่หรือไม่ได้ใช้งาน
หลังจากเสร็จสิ้นคำสั่ง รีจิสเตอร์คือ:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 61 46 00 00 00 a0 อุปกรณ์ขัดข้อง; ข้อผิดพลาด: ABRT
คำสั่งที่นำไปสู่คำสั่งที่ทำให้เกิดข้อผิดพลาดคือ:
CR FR SC SN CL CH DH DC Powered_Up_Time คำสั่ง/คุณลักษณะ_ชื่อ
-- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- ------------------ ------------------ --
ef 03 46 00 00 00 a0 00 04:00:16.815 คุณสมบัติการตั้งค่า [ตั้งค่าโหมดการถ่ายโอน]
ec 00 00 00 00 00 a0 00 04:00:16.815 อุปกรณ์ระบุตัวตน
e1 00 0f 00 00 00 00 00 04:00:15.095 ไม่ได้ใช้งานทันที
ef 03 46 00 00 00 a0 00 04:00:14.575 คุณสมบัติการตั้งค่า [ตั้งค่าโหมดการถ่ายโอน]
ec 00 00 00 00 00 a0 00 04:00:14.575 อุปกรณ์ระบุตัวตน
เกิดข้อผิดพลาด 45 เมื่อเปิดดิสก์ตลอดอายุการใช้งาน: 232 ชั่วโมง (9 วัน + 16 ชั่วโมง)
เมื่อคำสั่งที่ทำให้เกิดข้อผิดพลาดเกิดขึ้น อุปกรณ์ทำงานอยู่หรือไม่ได้ใช้งาน
หลังจากเสร็จสิ้นคำสั่ง รีจิสเตอร์คือ:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 61 0f 00 00 00 00
คำสั่งที่นำไปสู่คำสั่งที่ทำให้เกิดข้อผิดพลาดคือ:
CR FR SC SN CL CH DH DC Powered_Up_Time คำสั่ง/คุณลักษณะ_ชื่อ
-- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- ------------------ ------------------ --
e1 00 0f 00 00 00 00 00 04:00:15.095 ไม่ได้ใช้งานทันที
ef 03 46 00 00 00 a0 00 04:00:14.575 คุณสมบัติการตั้งค่า [ตั้งค่าโหมดการถ่ายโอน]
ec 00 00 00 00 00 a0 00 04:00:14.575 อุปกรณ์ระบุตัวตน
เกิดข้อผิดพลาด 44 เมื่อเปิดดิสก์ตลอดอายุการใช้งาน: 232 ชั่วโมง (9 วัน + 16 ชั่วโมง)
เมื่อคำสั่งที่ทำให้เกิดข้อผิดพลาดเกิดขึ้น อุปกรณ์ทำงานอยู่หรือไม่ได้ใช้งาน
หลังจากเสร็จสิ้นคำสั่ง รีจิสเตอร์คือ:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 61 46 00 00 00 a0 อุปกรณ์ขัดข้อง; ข้อผิดพลาด: ABRT
คำสั่งที่นำไปสู่คำสั่งที่ทำให้เกิดข้อผิดพลาดคือ:
CR FR SC SN CL CH DH DC Powered_Up_Time คำสั่ง/คุณลักษณะ_ชื่อ
-- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- ------------------ ------------------ --
ef 03 46 00 00 00 a0 00 04:00:14.575 คุณสมบัติการตั้งค่า [ตั้งค่าโหมดการถ่ายโอน]
ec 00 00 00 00 00 a0 00 04:00:14.575 อุปกรณ์ระบุตัวตน
ef 03 46 00 00 00 a0 00 04:00:12.170 คุณสมบัติการตั้งค่า [ตั้งค่าโหมดการถ่ายโอน]
เกิดข้อผิดพลาด 43 เมื่อเปิดดิสก์ตลอดอายุการใช้งาน: 232 ชั่วโมง (9 วัน + 16 ชั่วโมง)
เมื่อคำสั่งที่ทำให้เกิดข้อผิดพลาดเกิดขึ้น อุปกรณ์ทำงานอยู่หรือไม่ได้ใช้งาน
หลังจากเสร็จสิ้นคำสั่ง รีจิสเตอร์คือ:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 61 46 00 00 00 a0 อุปกรณ์ขัดข้อง; ข้อผิดพลาด: ABRT
คำสั่งที่นำไปสู่คำสั่งที่ทำให้เกิดข้อผิดพลาดคือ:
CR FR SC SN CL CH DH DC Powered_Up_Time คำสั่ง/คุณลักษณะ_ชื่อ
-- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- ------------------ ------------------ --
ef 03 46 00 00 00 a0 00 04:00:12.170 คุณสมบัติการตั้งค่า [ตั้งค่าโหมดการถ่ายโอน]
ec 00 00 00 00 00 a0 00 04:00:12.170 อุปกรณ์ระบุตัวตน
e1 00 0f 00 00 00 00 00 04:00:10.445 ไม่ได้ใช้งานทันที
ef 03 46 00 00 00 a0 00 04:00:09.925 คุณสมบัติการตั้งค่า [ตั้งค่าโหมดการถ่ายโอน]
ec 00 00 00 00 00 a0 00 04:00:09.925 ระบุอุปกรณ์
การแก้ไขโครงสร้างบันทึกการทดสอบตัวเอง SMART หมายเลข 1
จำนวน Test_Description สถานะอายุการใช้งานที่เหลืออยู่ (ชั่วโมง) LBA_of_first_error
# 1 สั้นออฟไลน์ เสร็จสมบูรณ์: อ่านล้มเหลว 90% 17480 8467144
การแก้ไขโครงสร้างข้อมูลบันทึกการทดสอบตัวเอง SMART Selective หมายเลข 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 ไม่ทดสอบ
3 0 0 ไม่ทดสอบ
4 0 0 ไม่ทดสอบ
5 0 0 ไม่ทดสอบ
การตั้งค่าสถานะการทดสอบตัวเองแบบเลือก (0x0):
หลังจากสแกนช่วงเวลาที่เลือกแล้ว อย่าอ่าน-สแกนส่วนที่เหลือของดิสก์
หากการทดสอบตัวเองแบบเลือกกำลังอยู่ระหว่างการเปิดเครื่อง ให้ดำเนินการต่อหลังจากหน่วงเวลา 0 นาที
จากนั้นฉันพยายามตรวจสอบบน LBA_of_first_error
(8467144) และติดตามส่วนหนึ่งของ คู่มือนี้, ฉันวิ่ง sudo sg_verify --lba=8467144 /dev/sda
รับผลลัพธ์ต่อไปนี้ที่ยืนยันว่ามีความล้มเหลวของฮาร์ดแวร์:
ตรวจสอบ (10):
รูปแบบคงที่ ปัจจุบัน; คีย์ความรู้สึก: ข้อผิดพลาดปานกลาง
ความหมายเพิ่มเติม: ข้อผิดพลาด Id CRC หรือ ECC
VERIFY(10) ข้อผิดพลาดปานกลางหรือฮาร์ดแวร์ใกล้กับ lba=0x8132c8
ในขั้นตอนสุดท้าย ฉันพยายามกำหนดบล็อกใหม่โดยไม่สำเร็จ sudo sg_reassign --address=8467144 /dev/sda
:
REASSIGN BLOCKS: คำขอที่ผิดกฎหมาย opcode ไม่ถูกต้อง
sg_reassign ล้มเหลว: คำขอไม่ถูกต้อง opcode ไม่ถูกต้อง
สรุปแล้ว ฉันพลาดขั้นตอนบางอย่างในการตรวจสอบดิสก์นี้หรือไม่ ไดรฟ์ของฉันเสียหรือยังสามารถใช้งานได้? ฉันไม่สามารถเข้าใจได้ว่ามีข้อผิดพลาดบางอย่างจากรายการ SMART Attribute หรือไม่ คุณสามารถช่วยฉันทำความเข้าใจว่าไดรฟ์มีข้อผิดพลาดเพิ่มเติมหรือไม่