หลังจากสังเกตเห็นความล่าช้าในการทำงานของดิสก์ที่นานผิดปกติ ฉันค้นหาใน journalctl และนี่คือสิ่งที่ฉันพบ:
22 ก.พ. 14:02:11.711182 เคอร์เนล Onan01: ata10: ลิงก์ฮาร์ดรีเซ็ต
22 ก.พ. 14:02:12.186958 เคอร์เนล Onan01: ata10: ลิงก์ SATA สูงสุด 1.5 Gbps (Sstatus 113 SControl 310)
22 ก.พ. 14:02:12.187044 เคอร์เนล Onan01: ata10.00: กำหนดค่าสำหรับ UDMA/33
22 ก.พ. 14:02:12.187068 เคอร์เนล Onan01: ata10: EH เสร็จสมบูรณ์
22 ก.พ. 14:02:22.782960 เคอร์เนล Onan01: ata10: ลิงก์ SATA สูงสุด 1.5 Gbps (Sstatus 113 SControl 310)
22 ก.พ. 14:02:22.783033 เคอร์เนล Onan01: ata10.00: กำหนดค่าสำหรับ UDMA/33
22 ก.พ. 14:03:27.472083 เคอร์เนล Onan01: ata10.00: ข้อยกเว้น Emask 0x0 SAct 0x0 SErr 0xd0000 การกระทำ 0x6 แช่แข็ง
22 กุมภาพันธ์ 14:03:27.472241 เคอร์เนล Onan01: ata10: SError: { PHYRdyChg CommWake 10B8B }
22 ก.พ. 14:03:27.472271 เคอร์เนล Onan01: ata10.00: คำสั่งล้มเหลว: WRITE DMA EXT
22 ก.พ. 14:03:27.472300 เคอร์เนล Onan01: ata10.00: cmd 35/00:18:00:35:44/00:00:74:00:00/e0 แท็ก 14 dma 12288 ออก
ความละเอียด 40/00:01:00:4f:c2/00:00:00:00:00/00 Emask 0x4 (หมดเวลา)
22 ก.พ. 14:03:27.472323 เคอร์เนล Onan01: ata10.00: สถานะ: { DRDY }
22 ก.พ. 14:03:27.472345 เคอร์เนล Onan01: ata10: ลิงก์ฮาร์ดรีเซ็ต
22 ก.พ. 14:03:27.950979 เคอร์เนล Onan01: ata10: ลิงก์ SATA สูงสุด 1.5 Gbps (Sstatus 113 SControl 310)
22 ก.พ. 14:03:27.951084 เคอร์เนล Onan01: ata10.00: กำหนดค่าสำหรับ UDMA/33
22 ก.พ. 14:03:27.951113 เคอร์เนล Onan01: ata10: EH เสร็จสมบูรณ์
22 กุมภาพันธ์ 14:04:03.852081 เคอร์เนล Onan01: ata10.00: ข้อยกเว้น Emask 0x10 SAct 0x0 SErr 0x40d0000 การกระทำ 0xe แช่แข็ง
22 ก.พ. 14:04:03.852242 เคอร์เนล Onan01: ata10.00: irq_stat 0x00000040 สถานะการเชื่อมต่อเปลี่ยนไป
22 กุมภาพันธ์ 14:04:03.852274 เคอร์เนล Onan01: ata10: SError: { PHYRdyChg CommWake 10B8B DevExch }
22 ก.พ. 14:04:03.852301 เคอร์เนล Onan01: ata10.00: คำสั่งล้มเหลว: WRITE DMA EXT
22 ก.พ. 14:04:03.852325 เคอร์เนล Onan01: ata10.00: cmd 35/00:38:58:35:44/00:00:74:00:00/e0 แท็ก 17 dma 28672 ออก
ความละเอียด 50/00:00:38:23:00/00:00:ac:00:00/e0 Emask 0x10 (ข้อผิดพลาดบัส ATA)
22 ก.พ. 14:04:03.852357 เคอร์เนล Onan01: ata10.00: สถานะ: { DRDY }
ข้อผิดพลาดประเภทแรก (การหมดเวลา) ดูเหมือนบ่อยกว่าข้อผิดพลาดประเภทที่สอง (ข้อผิดพลาดบัส ATA) แต่ละอย่างมีจำนวนค่อนข้างมาก ช่อง SATA ata10
เชื่อมต่อกับ WD Caviar Green HDD
การวินิจฉัย SMART บนดิสก์นี้ดูเหมือนจะสะอาด:
sudo smartctl --all /dev/sdf1
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-100-generic] (รุ่นในเครื่อง)
ลิขสิทธิ์ (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org
=== จุดเริ่มต้นของส่วนข้อมูล ===
รุ่นอุปกรณ์: WDC WD20EZAZ-00GGJB0
หมายเลขซีเรียล: WD-WXT1A29LE265
รหัสอุปกรณ์ LU WWN: 5 0014ee 211b07a4f
เวอร์ชันเฟิร์มแวร์: 80.00A80
ความจุของผู้ใช้: 2,000,398,934,016 ไบต์ [2.00 TB]
ขนาดเซกเตอร์: โลจิคัล 512 ไบต์ ฟิสิคัล 4096 ไบต์
อัตราการหมุน: 5400 รอบต่อนาที
ฟอร์มแฟคเตอร์: 3.5 นิ้ว
อุปกรณ์คือ: ไม่อยู่ในฐานข้อมูล smartctl [สำหรับรายละเอียดใช้: -P showall]
เวอร์ชัน ATA คือ: การแก้ไข ACS-3 T13/2161-D 5
เวอร์ชัน SATA คือ: SATA 3.1, 6.0 Gb/s (ปัจจุบัน: 6.0 Gb/s)
เวลาท้องถิ่น: วันพุธที่ 23 กุมภาพันธ์ 11:37:14 น. 2022 IST
การสนับสนุน SMART คือ: พร้อมใช้งาน - อุปกรณ์มีความสามารถ SMART
การสนับสนุน SMART คือ: เปิดใช้งาน
=== จุดเริ่มต้นของการอ่านข้อมูลสมาร์ทส่วน ===
ผลการทดสอบการประเมินตนเองด้านสุขภาพโดยรวมของ SMART: ผ่าน
ค่า SMART ทั่วไป:
สถานะการรวบรวมข้อมูลออฟไลน์: (0x00) กิจกรรมการรวบรวมข้อมูลออฟไลน์
ไม่เคยเริ่มต้น
การรวบรวมข้อมูลออฟไลน์อัตโนมัติ: ปิดใช้งาน
สถานะการดำเนินการทดสอบตัวเอง: ( 0) รูทีนการทดสอบตัวเองก่อนหน้านี้เสร็จสิ้น
โดยไม่มีข้อผิดพลาดหรือไม่มีการทดสอบตัวเองเลย
ถูกเรียกใช้
เวลาทั้งหมดในการทำออฟไลน์ให้เสร็จ
การรวบรวมข้อมูล: (32520) วินาที
การรวบรวมข้อมูลออฟไลน์
ความสามารถ: (0x7b) SMART ดำเนินการออฟไลน์ทันที
รองรับการเปิด/ปิดการรวบรวมข้อมูลออฟไลน์อัตโนมัติ
ระงับคอลเลกชันออฟไลน์เมื่อใหม่
สั่งการ.
รองรับการสแกนพื้นผิวแบบออฟไลน์
รองรับการทดสอบตัวเอง
รองรับการทดสอบตัวเองของพาหนะ
รองรับการทดสอบตัวเองแบบ Selective
ความสามารถ SMART: (0x0003) บันทึกข้อมูล SMART ก่อนเข้า
โหมดประหยัดพลังงาน.
รองรับตัวจับเวลาบันทึกอัตโนมัติ SMART
ความสามารถในการบันทึกข้อผิดพลาด: (0x01) รองรับการบันทึกข้อผิดพลาด
รองรับการบันทึกวัตถุประสงค์ทั่วไป
ขั้นตอนการทดสอบตัวเองสั้นๆ
เวลาสำรวจที่แนะนำ: ( 2) นาที
รูทีนการทดสอบตัวเองเพิ่มเติม
เวลาสำรวจที่แนะนำ: ( 103) นาที
รูทีนการทดสอบตัวเองของพาหนะ
เวลาสำรวจที่แนะนำ: ( 2) นาที
ความสามารถของ SCT: (0x3035) รองรับสถานะ SCT
รองรับการควบคุมคุณสมบัติ SCT
รองรับตารางข้อมูล SCT
หมายเลขการแก้ไขโครงสร้างข้อมูลแอตทริบิวต์ SMART: 16
แอตทริบิวต์ SMART เฉพาะของผู้ขายที่มีเกณฑ์:
ID# ATTRIBUTE_NAME ค่าสถานะ ค่าสถานะ ประเภทที่แย่ที่สุด อัปเดตเมื่อ RAW_VALUE ล้มเหลว
1 Raw_Read_Error_Rate 0x002f 200 200 051 ผิดพลาดล่วงหน้าเสมอ - 0
3 Spin_Up_Time 0x0027 184 170 021 ก่อนล้มเหลวเสมอ - 1783
4 Start_Stop_Count 0x0032 099 099 000 Old_age เสมอ - 1573
5 Reallocated_Sector_Ct 0x0033 200 200 140 ล้มเหลวล่วงหน้าเสมอ - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age เสมอ - 0
9 Power_On_Hours 0x0032 083 083 000 Old_age เสมอ - 13100
10 Spin_Retry_Count 0x0032 100 100 000 Old_age เสมอ - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age เสมอ - 0
12 Power_Cycle_Count 0x0032 099 099 000 Old_age เสมอ - 1524
192 Power-Off_Retract_Count 0x0032 199 199 000 Old_age เสมอ - 761
193 Load_Cycle_Count 0x0032 147 147 000 Old_age เสมอ - 160779
194 อุณหภูมิ_เซลเซียส 0x0022 115 104 000 Old_age เสมอ - 28
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age เสมอ - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age เสมอ - 0
198 ออฟไลน์_แก้ไขไม่ได้ 0x0030 100 253 000 Old_age ออฟไลน์ - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age เสมอ - 0
200 Multi_Zone_Error_Rate 0x0008 100 253 000 Old_age ออฟไลน์ - 0
เวอร์ชันบันทึกข้อผิดพลาด SMART: 1
ไม่มีการบันทึกข้อผิดพลาด
การแก้ไขโครงสร้างบันทึกการทดสอบตัวเอง SMART หมายเลข 1
จำนวน Test_Description สถานะอายุการใช้งานที่เหลืออยู่ (ชั่วโมง) LBA_of_first_error
# 1 ออฟไลน์สั้น ๆ เสร็จสมบูรณ์โดยไม่มีข้อผิดพลาด 00% 13100 -
# 2 ออฟไลน์สั้น ๆ เสร็จสมบูรณ์โดยไม่มีข้อผิดพลาด 00% 13099 -
การแก้ไขโครงสร้างข้อมูลบันทึกการทดสอบตัวเอง SMART Selective หมายเลข 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 ไม่ทดสอบ
3 0 0 ไม่ทดสอบ
4 0 0 ไม่ทดสอบ
5 0 0 ไม่ทดสอบ
การตั้งค่าสถานะการทดสอบตัวเองแบบเลือก (0x0):
หลังจากสแกนช่วงเวลาที่เลือกแล้ว อย่าอ่าน-สแกนส่วนที่เหลือของดิสก์
หากการทดสอบตัวเองแบบเลือกกำลังอยู่ระหว่างการเปิดเครื่อง ให้ดำเนินการต่อหลังจากหน่วงเวลา 0 นาที
สิ่งหนึ่งที่น่าแปลกคือ การทดสอบ SMART แบบยาวดูเหมือนจะไม่ได้ผล พวกเขาเปลี่ยนจากความคืบหน้า 90% เป็นเสร็จสิ้นโดยตรง (ไม่มี 80%, 70% ฯลฯ) และหลังจากนั้นจะไม่แสดงในส่วน "บันทึกการทดสอบตัวเอง SMART"
ฉันประสบปัญหาการทำงานของไฟล์ล่าช้าเป็นเวลาสองวันติดต่อกัน หลังจากรีบูตเครื่อง ปัญหาจะหายไปและกลับมาอีก โดยเฉพาะอย่างยิ่งปัญหาจะอยู่ในรูปของความล่าช้าในการคัดลอกหรือย้ายไฟล์ และใน LibreOffice ค้างอยู่ที่การบันทึกไฟล์ มีความคิดว่าอะไรเป็นสาเหตุของข้อผิดพลาดดังกล่าว
ระบบปฏิบัติการ: อูบุนตู 20.04
หน่วยประมวลผล: Ryzen 3
MB: Gigabyte X570 UD