เซิร์ฟเวอร์ทั้งสองของเราประสบปัญหา
mdstat ไม่ตรงกัน cnt บล็อกที่ไม่ซิงโครไนซ์
ทุกต้นเดือนเราได้รับข้อผิดพลาดนี้และเราต้องซ่อมแซมการจู่โจมโดยใช้
echo 'repair' >/sys/block/<md id>/md/sync_action
การตรวจสอบนี้เกิดจาก mdcheck_start.timer.service ถ้าจำไม่ผิด
ใช้เวลาซ่อมประมาณ 5 ชั่วโมง หลังจากนั้นก็ซ่อมเอง หรืออย่างน้อยผมก็คิดอย่างนั้น
คำถามคือว่านี่เป็นวิธีที่ถูกต้องในการแก้ไขบล็อกการโจมตีที่ไม่ซิงโครไนซ์หรือไม่ อะไรเป็นสาเหตุและฉันจะบอกได้อย่างไรว่าเป็นข้อผิดพลาดของฮาร์ดแวร์/ดิสก์
ขอขอบคุณ!
แก้ไข: / etc / fstab มี:
# /etc/fstab: ข้อมูลระบบไฟล์คงที่
# / เปิด /dev/md2p1 ระหว่างการติดตั้งเคอร์ติน
/dev/disk/by-id/md-uuid-b0b68adb:353b70e8:fa806910:a78761e9-part1 / ext4 ค่าเริ่มต้น 0 0
# /vol/data เปิดอยู่ /dev/md3p1 ระหว่างการติดตั้งเคอร์ติน
/dev/disk/by-id/md-uuid-2360fc63:991922f4:33aae17f:12f23590-part1 /vol/data ext4 ค่าเริ่มต้น 0 0
# /boot เปิด /dev/md0p1 ระหว่างการติดตั้งเคอร์ติน
/dev/disk/by-id/md-uuid-a76428ff:270597e7:70ed6c91:026d2441-part1 /boot ext4 ค่าเริ่มต้น 0 0
UUID="5c389b41-007d-4893-b81c-5560cb2d6ff9" /vol/backup ext4 ค่าเริ่มต้น 0 0
172.30.0.199:/vol/shared /vol/shared nfs เริ่มต้น 0 0
ผลลัพธ์ของ lsblk -- ยกเลิก
:
ชื่อ DISC-ALN DISC-GRAN DISC-MAX DISC-ZERO
ลูป0 0 4K 4G 0
ลูป1 0 4K 4G 0
ลูป2 0 4K 4G 0
ลูป3 0 4K 4G 0
ลูป4 0 4K 4G 0
ลูป5 0 4K 4G 0
ลูป6 0 4K 4G 0
ลูป7 0 4K 4G 0
ลูป8 0 4K 4G 0
sda 0 4K 2G 0
ââsda1 0 4K 2G 0
ââsda2 0 4K 2G 0
â ââmd0 0 4K 2G 0
â ââmd0p1 0 4K 2G 0
ââsda3 0 4K 2G 0
â ââmd1 0 4K 2G 0
â ââmd1p1 0 4K 2G 0
ââsda4 0 4K 2G 0
ââmd2 0 4K 2G 0
ââmd2p1 0 4K 2G 0
เอสดีบี 0 4K 2G 0
ââsdb1 0 4K 2G 0
ââsdb2 0 4K 2G 0
â ââmd0 0 4K 2G 0
â ââmd0p1 0 4K 2G 0
ââsdb3 0 4K 2G 0
â ââmd1 0 4K 2G 0
â ââmd1p1 0 4K 2G 0
ââsdb4 0 4K 2G 0
ââmd2 0 4K 2G 0
ââmd2p1 0 4K 2G 0
เอสดีซี 0 0B 0B 0
ââsdc1 0 0B 0B 0
nvme1n1 0 512B 2T 0
ââmd3 0 512B 2T 0
ââmd3p1 0 512B 2T 0
nvme0n1 0 512B 2T 0
ââmd3 0 512B 2T 0
ââmd3p1 0 512B 2T 0
ผลลัพธ์ของ smartctl -i /dev/sd[ab]
:
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-92-generic] (รุ่นในเครื่อง)
ลิขสิทธิ์ (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org
=== จุดเริ่มต้นของส่วนข้อมูล ===
ตระกูลรุ่น: Intel S4510/S4610/S4500/S4600 Series SSD
รุ่นอุปกรณ์: INTEL SSDSC2KG960G8
หมายเลขซีเรียล: BTYG024601ZC960CGN
รหัสอุปกรณ์ LU WWN: 5 5cd2e4 152b3fddf
เวอร์ชันเฟิร์มแวร์: XCV10120
ความจุของผู้ใช้: 960,197,124,096 ไบต์ [960 GB]
ขนาดเซกเตอร์: โลจิคัล 512 ไบต์ ฟิสิคัล 4096 ไบต์
อัตราการหมุน: อุปกรณ์ Solid State
ฟอร์มแฟคเตอร์: 2.5 นิ้ว
อุปกรณ์คือ: ในฐานข้อมูล smartctl [สำหรับรายละเอียดใช้: -P แสดง]
เวอร์ชัน ATA คือ: การแก้ไข ACS-3 T13/2161-D 5
เวอร์ชัน SATA คือ: SATA 3.2, 6.0 Gb/s (ปัจจุบัน: 6.0 Gb/s)
เวลาท้องถิ่นคือ: วันพุธที่ 2 กุมภาพันธ์ 07:43:15 น. 2022 CET
การสนับสนุน SMART คือ: พร้อมใช้งาน - อุปกรณ์มีความสามารถ SMART
การสนับสนุน SMART คือ: เปิดใช้งาน
ผลลัพธ์ของ mdadm --detail /dev/md2
:
/dev/md2:
เวอร์ชัน : 1.2
เวลาสร้าง : อังคาร 24 พ.ย. 21:02:34 น. 2563
ระดับการจู่โจม : การจู่โจม1
ขนาดอาร์เรย์ : 919731200 (877.12 GiB 941.80 GB)
ขนาด Dev ที่ใช้ : 919731200 (877.12 GiB 941.80 GB)
อุปกรณ์จู่โจม : 2
อุปกรณ์ทั้งหมด : 2
การคงอยู่: Superblock นั้นคงอยู่
บิตแมปเจตนา: ภายใน
อัปเดตเวลา : พุธ 2 ก.พ. 07:43:33 น. 2022
สถานะ: ใช้งานอยู่
อุปกรณ์ที่ใช้งาน : 2
อุปกรณ์การทำงาน : 2
อุปกรณ์ที่ล้มเหลว : 0
อุปกรณ์สำรอง : 0
นโยบายความสอดคล้อง: บิตแมป
ชื่อ : อูบุนตู-เซิร์ฟเวอร์:2
UUID : b0b68adb:353b70e8:fa806910:a78761e9
เหตุการณ์ : 24281
หมายเลขหลักรอง RaidDevice สถานะ
0 8 4 0 การซิงค์ที่ใช้งานอยู่ /dev/sda4
1 8 20 1 แอคทีฟซิงค์ /dev/sdb4
ผลลัพธ์ของ smartctl -A -l ข้อผิดพลาด /dev/sda.dll
:
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-92-generic] (รุ่นในเครื่อง)
ลิขสิทธิ์ (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org
=== จุดเริ่มต้นของการอ่านข้อมูลสมาร์ทส่วน ===
หมายเลขการแก้ไขโครงสร้างข้อมูลแอตทริบิวต์ SMART: 1
แอตทริบิวต์ SMART เฉพาะของผู้ขายที่มีเกณฑ์:
ID# ATTRIBUTE_NAME ค่าสถานะ ค่าสถานะ ประเภทที่แย่ที่สุด อัปเดตเมื่อ RAW_VALUE ล้มเหลว
5 Reallocated_Sector_Ct 0x0032 100 100 000 Old_age เสมอ - 0
9 Power_On_Hours 0x0032 100 100 000 Old_age เสมอ - 10469
12 Power_Cycle_Count 0x0032 100 100 000 Old_age เสมอ - 8
170 Available_Reservd_Space 0x0033 100 100 010 ล่วงหน้าล้มเหลวเสมอ - 0
171 Program_Fail_Count 0x0032 100 100 000 Old_age เสมอ - 0
172 Erase_Fail_Count 0x0032 100 100 000 Old_age เสมอ - 0
174 Unsafe_Shutdown_Count 0x0032 100 100 000 Old_age เสมอ - 7
175 Power_Loss_Cap_Test 0x0033 100 100 010 Pre-fail เสมอ - 2591 (8 65535)
183 SATA_Downshift_Count 0x0032 100 100 000 Old_age เสมอ - 0
184 End-to-End_Error_Count 0x0033 100 100 090 ผิดพลาดล่วงหน้าเสมอ - 0
187 Uncorrectable_Error_Cnt 0x0032 100 100 000 Old_age เสมอ - 0
190 Drive_Temperature 0x0022 079 075 000 Old_age เสมอ - 21 (ต่ำสุด/สูงสุด 12/27)
192 Unsafe_Shutdown_Count 0x0032 100 100 000 Old_age เสมอ - 7
194 อุณหภูมิ_เซลเซียส 0x0022 100 100 000 Old_age เสมอ - 21
197 Pending_Sector_Count 0x0012 100 100 000 Old_age เสมอ - 0
199 CRC_Error_Count 0x003e 100 100 000 Old_age เสมอ - 0
225 Host_Writes_32MiB 0x0032 100 100 000 Old_age เสมอ - 1006057
226 Workld_Media_Wear_Indic 0x0032 100 100 000 Old_age เสมอ - 419
227 Workld_Host_Reads_Perc 0x0032 100 100 000 Old_age เสมอ - 52
228 Workload_Minutes 0x0032 100 100 000 Old_age เสมอ - 628023
232 Available_Reservd_Space 0x0033 100 100 010 Pre-fail เสมอ - 0
233 Media_Wearout_Indicator 0x0032 100 100 000 Old_age เสมอ - 0
234 Thermal_Throttle_Status 0x0032 100 100 000 Old_age เสมอ - 0/0
235 Power_Loss_Cap_Test 0x0033 100 100 010 Pre-fail เสมอ - 2591 (8 65535)
241 Host_Writes_32MiB 0x0032 100 100 000 Old_age เสมอ - 1006057
242 Host_Reads_32MiB 0x0032 100 100 000 Old_age เสมอ - 1112548
243 NAND_Writes_32MiB 0x0032 100 100 000 Old_age เสมอ - 1730576
เวอร์ชันบันทึกข้อผิดพลาด SMART: 1
ไม่มีการบันทึกข้อผิดพลาด
ผลลัพธ์ของ smartctl -A -l ข้อผิดพลาด /dev/sdb
:
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-92-generic] (รุ่นในเครื่อง)
ลิขสิทธิ์ (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org
=== จุดเริ่มต้นของการอ่านข้อมูลสมาร์ทส่วน ===
หมายเลขการแก้ไขโครงสร้างข้อมูลแอตทริบิวต์ SMART: 1
แอตทริบิวต์ SMART เฉพาะของผู้ขายที่มีเกณฑ์:
ID# ATTRIBUTE_NAME ค่าสถานะ ค่าสถานะ ประเภทที่แย่ที่สุด อัปเดตเมื่อ RAW_VALUE ล้มเหลว
5 Reallocated_Sector_Ct 0x0032 100 100 000 Old_age เสมอ - 0
9 Power_On_Hours 0x0032 100 100 000 Old_age เสมอ - 10469
12 Power_Cycle_Count 0x0032 100 100 000 Old_age เสมอ - 8
170 Available_Reservd_Space 0x0033 100 100 010 ล่วงหน้าล้มเหลวเสมอ - 0
171 Program_Fail_Count 0x0032 100 100 000 Old_age เสมอ - 0
172 Erase_Fail_Count 0x0032 100 100 000 Old_age เสมอ - 0
174 Unsafe_Shutdown_Count 0x0032 100 100 000 Old_age เสมอ - 7
175 Power_Loss_Cap_Test 0x0033 100 100 010 Pre-fail เสมอ - 2479 (8 65535)
183 SATA_Downshift_Count 0x0032 100 100 000 Old_age เสมอ - 0
184 End-to-End_Error_Count 0x0033 100 100 090 ผิดพลาดล่วงหน้าเสมอ - 0
187 Uncorrectable_Error_Cnt 0x0032 100 100 000 Old_age เสมอ - 0
190 Drive_Temperature 0x0022 078 073 000 Old_age เสมอ - 22 (ต่ำสุด/สูงสุด 12/29)
192 Unsafe_Shutdown_Count 0x0032 100 100 000 Old_age เสมอ - 7
194 อุณหภูมิ_เซลเซียส 0x0022 100 100 000 Old_age เสมอ - 22
197 Pending_Sector_Count 0x0012 100 100 000 Old_age เสมอ - 0
199 CRC_Error_Count 0x003e 100 100 000 Old_age เสมอ - 0
225 Host_Writes_32MiB 0x0032 100 100 000 Old_age เสมอ - 1064411
226 Workld_Media_Wear_Indic 0x0032 100 100 000 Old_age เสมอ - 440
227 Workld_Host_Reads_Perc 0x0032 100 100 000 Old_age เสมอ - 45
228 Workload_Minutes 0x0032 100 100 000 Old_age เสมอ - 628005
232 Available_Reservd_Space 0x0033 100 100 010 Pre-fail เสมอ - 0
233 Media_Wearout_Indicator 0x0032 100 100 000 Old_age เสมอ - 0
234 Thermal_Throttle_Status 0x0032 100 100 000 Old_age เสมอ - 0/0
235 Power_Loss_Cap_Test 0x0033 100 100 010 Pre-fail เสมอ - 2479 (8 65535)
241 Host_Writes_32MiB 0x0032 100 100 000 Old_age เสมอ - 1064411
242 Host_Reads_32MiB 0x0032 100 100 000 Old_age เสมอ - 876800
243 NAND_Writes_32MiB 0x0032 100 100 000 Old_age เสมอ - 1801020
เวอร์ชันบันทึกข้อผิดพลาด SMART: 1
ไม่มีการบันทึกข้อผิดพลาด