Score:0

ไดร์ฟเสียหรือยังใช้งานได้?

ธง ie

ฉันมีไดรฟ์ WD (3TB) ต่อไปนี้ที่ทำให้ฉันมีปัญหา (ฉันไม่สามารถเข้าถึงไฟล์ใดๆ ได้: แม้แต่ คำสั่งนั้นทำให้เกิดการรอคอยที่ไม่มีวันสิ้นสุด)

นี่คือรายละเอียดบางอย่างบนดิสก์:

ดิสก์ /dev/sda: 2.7 TiB, 3000592982016 ไบต์, 5860533168 ภาคส่วน
รุ่นดิสก์: EZRX-00D8PB0
หน่วย: ภาค 1 * 512 = 512 ไบต์
ขนาดเซกเตอร์ (โลจิคัล/กายภาพ): 512 ไบต์ / 4096 ไบต์
ขนาด I/O (ต่ำสุด/เหมาะสม): 4096 ไบต์ / 4096 ไบต์
ประเภทป้ายชื่อดิสก์: gpt

ประเภทขนาดเซกเตอร์สิ้นสุดการเริ่มต้นของอุปกรณ์
/dev/sda1 2048 5860532223 5860530176 ระบบไฟล์ Linux 2.7T

หลังจากปัญหานี้ ฉันทำการทดสอบเพื่อค้นหาว่าปัญหาประเภทใดที่ส่งผลกระทบต่อมัน ในขั้นตอนแรกฉันทำการทดสอบสั้น ๆ sudo smartctl -t สั้น /dev/sda ที่แสดงข้อผิดพลาดต่อไปนี้ให้ฉันเห็น:

=== จุดเริ่มต้นของการอ่านข้อมูลสมาร์ทส่วน ===
การแก้ไขโครงสร้างบันทึกการทดสอบตัวเอง SMART หมายเลข 1
จำนวน Test_Description สถานะอายุการใช้งานที่เหลืออยู่ (ชั่วโมง) LBA_of_first_error
# 1 สั้นออฟไลน์ เสร็จสมบูรณ์: อ่านล้มเหลว 90% 17480 8467144

จากนั้นฉันพยายามรับคุณสมบัติบางอย่างตามที่อธิบายไว้ในโพสต์อื่นนี้ ทำความเข้าใจกับ smartctl -a เอาต์พุต โดยใช้ sudo smartctl -a /dev/sda. คุณจะพบตารางแอตทริบิวต์และบันทึกข้อผิดพลาดล่าสุด 5 รายการได้ที่นี่

หมายเลขการแก้ไขโครงสร้างข้อมูลแอตทริบิวต์ SMART: 16
แอตทริบิวต์ SMART เฉพาะของผู้ขายที่มีเกณฑ์:
ID# ATTRIBUTE_NAME ค่าสถานะ ค่าสถานะ ประเภทที่แย่ที่สุด อัปเดตเมื่อ RAW_VALUE ล้มเหลว
  1 Raw_Read_Error_Rate 0x002f 200 200 051 ผิดพลาดล่วงหน้าเสมอ - 71
  3 Spin_Up_Time 0x0027 174 161 021 ก่อนล้มเหลวเสมอ - 6266
  4 Start_Stop_Count 0x0032 100 100 000 Old_age เสมอ - 695
  5 Reallocated_Sector_Ct 0x0033 200 200 140 ล้มเหลวล่วงหน้าเสมอ - 0
  7 Seek_Error_Rate 0x002e 200 200 000 Old_age เสมอ - 0
  9 Power_On_Hours 0x0032 077 077 000 Old_age เสมอ - 17481
 10 Spin_Retry_Count 0x0032 100 100 000 Old_age เสมอ - 0
 11 Calibration_Retry_Count 0x0032 100 100 000 Old_age เสมอ - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Old_age เสมอ - 457
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age เสมอ - 63
193 Load_Cycle_Count 0x0032 179 179 000 Old_age เสมอ - 64193
194 อุณหภูมิ_เซลเซียส 0x0022 122 101 000 Old_age เสมอ - 28
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age เสมอ - 0
197 Current_Pending_Sector 0x0032 200 197 000 Old_age เสมอ - 356
198 ออฟไลน์_แก้ไขไม่ได้ 0x0030 197 197 000 Old_age ออฟไลน์ - 1691
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age เสมอ - 0
200 Multi_Zone_Error_Rate 0x0008 196 196 000 Old_age ออฟไลน์ - 1691

เวอร์ชันบันทึกข้อผิดพลาด SMART: 1
จำนวนข้อผิดพลาด ATA: 47 (บันทึกอุปกรณ์มีข้อผิดพลาดห้ารายการล่าสุดเท่านั้น)
        CR = การลงทะเบียนคำสั่ง [HEX]
        FR = คุณสมบัติลงทะเบียน [HEX]
        SC = ทะเบียนนับภาค [HEX]
        SN = ลงทะเบียนหมายเลขเซกเตอร์ [HEX]
        CL = การลงทะเบียนกระบอกสูบต่ำ [HEX]
        CH = ทะเบียนทรงกระบอกสูง [HEX]
        DH = ทะเบียนอุปกรณ์/ส่วนหัว [HEX]
        DC = การลงทะเบียนคำสั่งอุปกรณ์ [HEX]
        ER = ข้อผิดพลาดในการลงทะเบียน [HEX]
        ST = การลงทะเบียนสถานะ [HEX]
Powered_Up_Time วัดจากการเปิดเครื่อง และพิมพ์เป็น
DDd+hh:mm:SS.sss โดยที่ DD=วัน, hh=ชั่วโมง, mm=นาที
SS=วินาที และ sss=มิลลิวินาที มัน "ห่อ" หลังจาก 49.710 วัน

เกิดข้อผิดพลาด 47 เมื่อเปิดดิสก์ตลอดอายุการใช้งาน: 232 ชั่วโมง (9 วัน + 16 ชั่วโมง)
  เมื่อคำสั่งที่ทำให้เกิดข้อผิดพลาดเกิดขึ้น อุปกรณ์ทำงานอยู่หรือไม่ได้ใช้งาน

  หลังจากเสร็จสิ้นคำสั่ง รีจิสเตอร์คือ:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 61 0a 00 00 00 00

  คำสั่งที่นำไปสู่คำสั่งที่ทำให้เกิดข้อผิดพลาดคือ:
  CR FR SC SN CL CH DH DC Powered_Up_Time คำสั่ง/คุณลักษณะ_ชื่อ
  -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- ------------------ ------------------ --
  e0 00 0a 00 00 00 00 00 04:00:17.522 สแตนด์บายทันที
  ef 03 46 00 00 00 a0 00 04:00:16.815 คุณสมบัติการตั้งค่า [ตั้งค่าโหมดการถ่ายโอน]
  ec 00 00 00 00 00 a0 00 04:00:16.815 อุปกรณ์ระบุตัวตน

เกิดข้อผิดพลาด 46 เมื่อเปิดดิสก์ตลอดอายุการใช้งาน: 232 ชั่วโมง (9 วัน + 16 ชั่วโมง)
  เมื่อคำสั่งที่ทำให้เกิดข้อผิดพลาดเกิดขึ้น อุปกรณ์ทำงานอยู่หรือไม่ได้ใช้งาน

  หลังจากเสร็จสิ้นคำสั่ง รีจิสเตอร์คือ:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 61 46 00 00 00 a0 อุปกรณ์ขัดข้อง; ข้อผิดพลาด: ABRT

  คำสั่งที่นำไปสู่คำสั่งที่ทำให้เกิดข้อผิดพลาดคือ:
  CR FR SC SN CL CH DH DC Powered_Up_Time คำสั่ง/คุณลักษณะ_ชื่อ
  -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- ------------------ ------------------ --
  ef 03 46 00 00 00 a0 00 04:00:16.815 คุณสมบัติการตั้งค่า [ตั้งค่าโหมดการถ่ายโอน]
  ec 00 00 00 00 00 a0 00 04:00:16.815 อุปกรณ์ระบุตัวตน
  e1 00 0f 00 00 00 00 00 04:00:15.095 ไม่ได้ใช้งานทันที
  ef 03 46 00 00 00 a0 00 04:00:14.575 คุณสมบัติการตั้งค่า [ตั้งค่าโหมดการถ่ายโอน]
  ec 00 00 00 00 00 a0 00 04:00:14.575 อุปกรณ์ระบุตัวตน

เกิดข้อผิดพลาด 45 เมื่อเปิดดิสก์ตลอดอายุการใช้งาน: 232 ชั่วโมง (9 วัน + 16 ชั่วโมง)
  เมื่อคำสั่งที่ทำให้เกิดข้อผิดพลาดเกิดขึ้น อุปกรณ์ทำงานอยู่หรือไม่ได้ใช้งาน

  หลังจากเสร็จสิ้นคำสั่ง รีจิสเตอร์คือ:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 61 0f 00 00 00 00

  คำสั่งที่นำไปสู่คำสั่งที่ทำให้เกิดข้อผิดพลาดคือ:
  CR FR SC SN CL CH DH DC Powered_Up_Time คำสั่ง/คุณลักษณะ_ชื่อ
  -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- ------------------ ------------------ --
  e1 00 0f 00 00 00 00 00 04:00:15.095 ไม่ได้ใช้งานทันที
  ef 03 46 00 00 00 a0 00 04:00:14.575 คุณสมบัติการตั้งค่า [ตั้งค่าโหมดการถ่ายโอน]
  ec 00 00 00 00 00 a0 00 04:00:14.575 อุปกรณ์ระบุตัวตน

เกิดข้อผิดพลาด 44 เมื่อเปิดดิสก์ตลอดอายุการใช้งาน: 232 ชั่วโมง (9 วัน + 16 ชั่วโมง)
  เมื่อคำสั่งที่ทำให้เกิดข้อผิดพลาดเกิดขึ้น อุปกรณ์ทำงานอยู่หรือไม่ได้ใช้งาน

  หลังจากเสร็จสิ้นคำสั่ง รีจิสเตอร์คือ:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 61 46 00 00 00 a0 อุปกรณ์ขัดข้อง; ข้อผิดพลาด: ABRT

  คำสั่งที่นำไปสู่คำสั่งที่ทำให้เกิดข้อผิดพลาดคือ:
  CR FR SC SN CL CH DH DC Powered_Up_Time คำสั่ง/คุณลักษณะ_ชื่อ
  -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- ------------------ ------------------ --
  ef 03 46 00 00 00 a0 00 04:00:14.575 คุณสมบัติการตั้งค่า [ตั้งค่าโหมดการถ่ายโอน]
  ec 00 00 00 00 00 a0 00 04:00:14.575 อุปกรณ์ระบุตัวตน
  ef 03 46 00 00 00 a0 00 04:00:12.170 คุณสมบัติการตั้งค่า [ตั้งค่าโหมดการถ่ายโอน]

เกิดข้อผิดพลาด 43 เมื่อเปิดดิสก์ตลอดอายุการใช้งาน: 232 ชั่วโมง (9 วัน + 16 ชั่วโมง)
  เมื่อคำสั่งที่ทำให้เกิดข้อผิดพลาดเกิดขึ้น อุปกรณ์ทำงานอยู่หรือไม่ได้ใช้งาน

  หลังจากเสร็จสิ้นคำสั่ง รีจิสเตอร์คือ:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 61 46 00 00 00 a0 อุปกรณ์ขัดข้อง; ข้อผิดพลาด: ABRT

  คำสั่งที่นำไปสู่คำสั่งที่ทำให้เกิดข้อผิดพลาดคือ:
  CR FR SC SN CL CH DH DC Powered_Up_Time คำสั่ง/คุณลักษณะ_ชื่อ
  -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- ------------------ ------------------ --
  ef 03 46 00 00 00 a0 00 04:00:12.170 คุณสมบัติการตั้งค่า [ตั้งค่าโหมดการถ่ายโอน]
  ec 00 00 00 00 00 a0 00 04:00:12.170 อุปกรณ์ระบุตัวตน
  e1 00 0f 00 00 00 00 00 04:00:10.445 ไม่ได้ใช้งานทันที
  ef 03 46 00 00 00 a0 00 04:00:09.925 คุณสมบัติการตั้งค่า [ตั้งค่าโหมดการถ่ายโอน]
  ec 00 00 00 00 00 a0 00 04:00:09.925 ระบุอุปกรณ์

การแก้ไขโครงสร้างบันทึกการทดสอบตัวเอง SMART หมายเลข 1
จำนวน Test_Description สถานะอายุการใช้งานที่เหลืออยู่ (ชั่วโมง) LBA_of_first_error
# 1 สั้นออฟไลน์ เสร็จสมบูรณ์: อ่านล้มเหลว 90% 17480 8467144

การแก้ไขโครงสร้างข้อมูลบันทึกการทดสอบตัวเอง SMART Selective หมายเลข 1
 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
    1 0 0 Not_testing
    2 0 0 ไม่ทดสอบ
    3 0 0 ไม่ทดสอบ
    4 0 0 ไม่ทดสอบ
    5 0 0 ไม่ทดสอบ
การตั้งค่าสถานะการทดสอบตัวเองแบบเลือก (0x0):
  หลังจากสแกนช่วงเวลาที่เลือกแล้ว อย่าอ่าน-สแกนส่วนที่เหลือของดิสก์
หากการทดสอบตัวเองแบบเลือกกำลังอยู่ระหว่างการเปิดเครื่อง ให้ดำเนินการต่อหลังจากหน่วงเวลา 0 นาที

จากนั้นฉันพยายามตรวจสอบบน LBA_of_first_error (8467144) และติดตามส่วนหนึ่งของ คู่มือนี้, ฉันวิ่ง sudo sg_verify --lba=8467144 /dev/sda รับผลลัพธ์ต่อไปนี้ที่ยืนยันว่ามีความล้มเหลวของฮาร์ดแวร์:

ตรวจสอบ (10):
รูปแบบคงที่ ปัจจุบัน; คีย์ความรู้สึก: ข้อผิดพลาดปานกลาง
ความหมายเพิ่มเติม: ข้อผิดพลาด Id CRC หรือ ECC
VERIFY(10) ข้อผิดพลาดปานกลางหรือฮาร์ดแวร์ใกล้กับ lba=0x8132c8

ในขั้นตอนสุดท้าย ฉันพยายามกำหนดบล็อกใหม่โดยไม่สำเร็จ sudo sg_reassign --address=8467144 /dev/sda:

REASSIGN BLOCKS: คำขอที่ผิดกฎหมาย opcode ไม่ถูกต้อง
sg_reassign ล้มเหลว: คำขอไม่ถูกต้อง opcode ไม่ถูกต้อง

สรุปแล้ว ฉันพลาดขั้นตอนบางอย่างในการตรวจสอบดิสก์นี้หรือไม่ ไดรฟ์ของฉันเสียหรือยังสามารถใช้งานได้? ฉันไม่สามารถเข้าใจได้ว่ามีข้อผิดพลาดบางอย่างจากรายการ SMART Attribute หรือไม่ คุณสามารถช่วยฉันทำความเข้าใจว่าไดรฟ์มีข้อผิดพลาดเพิ่มเติมหรือไม่

Brandon Xavier avatar
us flag
หากอยู่ในการรับประกันให้เปลี่ยนใหม่ ถ้าไม่ให้กำจัดมัน เมื่อไดรฟ์เริ่มรายงานข้อผิดพลาด การพยายามใช้ไดรฟ์ต่อไปก็เป็นเรื่องโง่เขลา
Michael Hampton avatar
cz flag
ข้อผิดพลาดเพียงครั้งเดียวก็เพียงพอแล้วสำหรับ RMA ไดรฟ์ แม้ว่ายังไม่มีแอตทริบิวต์ SMART ที่รายงานความล้มเหลวก็ตาม (ซึ่งจะเกิดในเร็วๆ นี้! และเมื่อถึงตอนนั้น ข้อมูลของคุณก็จะสายเกินไป)
Timmy avatar
ie flag
น่าเสียดายที่ดิสก์นี้มีมานานหลายปี จึงไม่มี RMA :(

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา