Score:0

mdstat ไม่ตรงกัน cnt บล็อกที่ไม่ซิงโครไนซ์

ธง us

เซิร์ฟเวอร์ทั้งสองของเราประสบปัญหา

mdstat ไม่ตรงกัน cnt บล็อกที่ไม่ซิงโครไนซ์

ทุกต้นเดือนเราได้รับข้อผิดพลาดนี้และเราต้องซ่อมแซมการจู่โจมโดยใช้

echo 'repair' >/sys/block/<md id>/md/sync_action

การตรวจสอบนี้เกิดจาก mdcheck_start.timer.service ถ้าจำไม่ผิด
ใช้เวลาซ่อมประมาณ 5 ชั่วโมง หลังจากนั้นก็ซ่อมเอง หรืออย่างน้อยผมก็คิดอย่างนั้น

คำถามคือว่านี่เป็นวิธีที่ถูกต้องในการแก้ไขบล็อกการโจมตีที่ไม่ซิงโครไนซ์หรือไม่ อะไรเป็นสาเหตุและฉันจะบอกได้อย่างไรว่าเป็นข้อผิดพลาดของฮาร์ดแวร์/ดิสก์ ขอขอบคุณ!

แก้ไข: / etc / fstab มี:

# /etc/fstab: ข้อมูลระบบไฟล์คงที่

# / เปิด /dev/md2p1 ระหว่างการติดตั้งเคอร์ติน
/dev/disk/by-id/md-uuid-b0b68adb:353b70e8:fa806910:a78761e9-part1 / ext4 ค่าเริ่มต้น 0 0

# /vol/data เปิดอยู่ /dev/md3p1 ระหว่างการติดตั้งเคอร์ติน
/dev/disk/by-id/md-uuid-2360fc63:991922f4:33aae17f:12f23590-part1 /vol/data ext4 ค่าเริ่มต้น 0 0

# /boot เปิด /dev/md0p1 ระหว่างการติดตั้งเคอร์ติน
/dev/disk/by-id/md-uuid-a76428ff:270597e7:70ed6c91:026d2441-part1 /boot ext4 ค่าเริ่มต้น 0 0

UUID="5c389b41-007d-4893-b81c-5560cb2d6ff9" /vol/backup ext4 ค่าเริ่มต้น 0 0

172.30.0.199:/vol/shared /vol/shared nfs เริ่มต้น 0 0

ผลลัพธ์ของ lsblk -- ยกเลิก:

ชื่อ DISC-ALN DISC-GRAN DISC-MAX DISC-ZERO
ลูป0 0 4K 4G 0
ลูป1 0 4K 4G 0
ลูป2 0 4K 4G 0
ลูป3 0 4K 4G 0
ลูป4 0 4K 4G 0
ลูป5 0 4K 4G 0
ลูป6 0 4K 4G 0
ลูป7 0 4K 4G 0
ลูป8 0 4K 4G 0
sda 0 4K 2G 0
ââsda1 0 4K 2G 0
ââsda2 0 4K 2G 0
â ââmd0 0 4K 2G 0
â ââmd0p1 0 4K 2G 0
ââsda3 0 4K 2G 0
â ââmd1 0 4K 2G 0
â ââmd1p1 0 4K 2G 0
ââsda4 0 4K 2G 0
  ââmd2 0 4K 2G 0
    ââmd2p1 0 4K 2G 0
เอสดีบี 0 4K 2G 0
ââsdb1 0 4K 2G 0
ââsdb2 0 4K 2G 0
â ââmd0 0 4K 2G 0
â ââmd0p1 0 4K 2G 0
ââsdb3 0 4K 2G 0
â ââmd1 0 4K 2G 0
â ââmd1p1 0 4K 2G 0
ââsdb4 0 4K 2G 0
  ââmd2 0 4K 2G 0
    ââmd2p1 0 4K 2G 0
เอสดีซี 0 0B 0B 0
ââsdc1 0 0B 0B 0
nvme1n1 0 512B 2T 0
ââmd3 0 512B 2T 0
  ââmd3p1 0 512B 2T 0
nvme0n1 0 512B 2T 0
ââmd3 0 512B 2T 0
  ââmd3p1 0 512B 2T 0

ผลลัพธ์ของ smartctl -i /dev/sd[ab]:

smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-92-generic] (รุ่นในเครื่อง)
ลิขสิทธิ์ (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== จุดเริ่มต้นของส่วนข้อมูล ===
ตระกูลรุ่น: Intel S4510/S4610/S4500/S4600 Series SSD
รุ่นอุปกรณ์: INTEL SSDSC2KG960G8
หมายเลขซีเรียล: BTYG024601ZC960CGN
รหัสอุปกรณ์ LU WWN: 5 5cd2e4 152b3fddf
เวอร์ชันเฟิร์มแวร์: XCV10120
ความจุของผู้ใช้: 960,197,124,096 ไบต์ [960 GB]
ขนาดเซกเตอร์: โลจิคัล 512 ไบต์ ฟิสิคัล 4096 ไบต์
อัตราการหมุน: อุปกรณ์ Solid State
ฟอร์มแฟคเตอร์: 2.5 นิ้ว
อุปกรณ์คือ: ในฐานข้อมูล smartctl [สำหรับรายละเอียดใช้: -P แสดง]
เวอร์ชัน ATA คือ: การแก้ไข ACS-3 T13/2161-D 5
เวอร์ชัน SATA คือ: SATA 3.2, 6.0 Gb/s (ปัจจุบัน: 6.0 Gb/s)
เวลาท้องถิ่นคือ: วันพุธที่ 2 กุมภาพันธ์ 07:43:15 น. 2022 CET
การสนับสนุน SMART คือ: พร้อมใช้งาน - อุปกรณ์มีความสามารถ SMART
การสนับสนุน SMART คือ: เปิดใช้งาน

ผลลัพธ์ของ mdadm --detail /dev/md2:

/dev/md2:
           เวอร์ชัน : 1.2
     เวลาสร้าง : อังคาร 24 พ.ย. 21:02:34 น. 2563
        ระดับการจู่โจม : การจู่โจม1
        ขนาดอาร์เรย์ : 919731200 (877.12 GiB 941.80 GB)
     ขนาด Dev ที่ใช้ : 919731200 (877.12 GiB 941.80 GB)
      อุปกรณ์จู่โจม : 2
     อุปกรณ์ทั้งหมด : 2
       การคงอยู่: Superblock นั้นคงอยู่

     บิตแมปเจตนา: ภายใน

       อัปเดตเวลา : พุธ 2 ก.พ. 07:43:33 น. 2022
             สถานะ: ใช้งานอยู่
    อุปกรณ์ที่ใช้งาน : 2
   อุปกรณ์การทำงาน : 2
    อุปกรณ์ที่ล้มเหลว : 0
     อุปกรณ์สำรอง : 0

นโยบายความสอดคล้อง: บิตแมป

              ชื่อ : อูบุนตู-เซิร์ฟเวอร์:2
              UUID : b0b68adb:353b70e8:fa806910:a78761e9
            เหตุการณ์ : 24281

    หมายเลขหลักรอง RaidDevice สถานะ
       0 8 4 0 การซิงค์ที่ใช้งานอยู่ /dev/sda4
       1 8 20 1 แอคทีฟซิงค์ /dev/sdb4

ผลลัพธ์ของ smartctl -A -l ข้อผิดพลาด /dev/sda.dll:

smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-92-generic] (รุ่นในเครื่อง)
ลิขสิทธิ์ (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== จุดเริ่มต้นของการอ่านข้อมูลสมาร์ทส่วน ===
หมายเลขการแก้ไขโครงสร้างข้อมูลแอตทริบิวต์ SMART: 1
แอตทริบิวต์ SMART เฉพาะของผู้ขายที่มีเกณฑ์:
ID# ATTRIBUTE_NAME ค่าสถานะ ค่าสถานะ ประเภทที่แย่ที่สุด อัปเดตเมื่อ RAW_VALUE ล้มเหลว
  5 Reallocated_Sector_Ct 0x0032 100 100 000 Old_age เสมอ - 0
  9 Power_On_Hours 0x0032 100 100 000 Old_age เสมอ - 10469
 12 Power_Cycle_Count 0x0032 100 100 000 Old_age เสมอ - 8
170 Available_Reservd_Space 0x0033 100 100 010 ล่วงหน้าล้มเหลวเสมอ - 0
171 Program_Fail_Count 0x0032 100 100 000 Old_age เสมอ - 0
172 Erase_Fail_Count 0x0032 100 100 000 Old_age เสมอ - 0
174 Unsafe_Shutdown_Count 0x0032 100 100 000 Old_age เสมอ - 7
175 Power_Loss_Cap_Test 0x0033 100 100 010 Pre-fail เสมอ - 2591 (8 65535)
183 SATA_Downshift_Count 0x0032 100 100 000 Old_age เสมอ - 0
184 End-to-End_Error_Count 0x0033 100 100 090 ผิดพลาดล่วงหน้าเสมอ - 0
187 Uncorrectable_Error_Cnt 0x0032 100 100 000 Old_age เสมอ - 0
190 Drive_Temperature 0x0022 079 075 000 Old_age เสมอ - 21 (ต่ำสุด/สูงสุด 12/27)
192 Unsafe_Shutdown_Count 0x0032 100 100 000 Old_age เสมอ - 7
194 อุณหภูมิ_เซลเซียส 0x0022 100 100 000 Old_age เสมอ - 21
197 Pending_Sector_Count 0x0012 100 100 000 Old_age เสมอ - 0
199 CRC_Error_Count 0x003e 100 100 000 Old_age เสมอ - 0
225 Host_Writes_32MiB 0x0032 100 100 000 Old_age เสมอ - 1006057
226 Workld_Media_Wear_Indic 0x0032 100 100 000 Old_age เสมอ - 419
227 Workld_Host_Reads_Perc 0x0032 100 100 000 Old_age เสมอ - 52
228 Workload_Minutes 0x0032 100 100 000 Old_age เสมอ - 628023
232 Available_Reservd_Space 0x0033 100 100 010 Pre-fail เสมอ - 0
233 Media_Wearout_Indicator 0x0032 100 100 000 Old_age เสมอ - 0
234 Thermal_Throttle_Status 0x0032 100 100 000 Old_age เสมอ - 0/0
235 Power_Loss_Cap_Test 0x0033 100 100 010 Pre-fail เสมอ - 2591 (8 65535)
241 Host_Writes_32MiB 0x0032 100 100 000 Old_age เสมอ - 1006057
242 Host_Reads_32MiB 0x0032 100 100 000 Old_age เสมอ - 1112548
243 NAND_Writes_32MiB 0x0032 100 100 000 Old_age เสมอ - 1730576

เวอร์ชันบันทึกข้อผิดพลาด SMART: 1
ไม่มีการบันทึกข้อผิดพลาด

ผลลัพธ์ของ smartctl -A -l ข้อผิดพลาด /dev/sdb:

smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-92-generic] (รุ่นในเครื่อง)
ลิขสิทธิ์ (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== จุดเริ่มต้นของการอ่านข้อมูลสมาร์ทส่วน ===
หมายเลขการแก้ไขโครงสร้างข้อมูลแอตทริบิวต์ SMART: 1
แอตทริบิวต์ SMART เฉพาะของผู้ขายที่มีเกณฑ์:
ID# ATTRIBUTE_NAME ค่าสถานะ ค่าสถานะ ประเภทที่แย่ที่สุด อัปเดตเมื่อ RAW_VALUE ล้มเหลว
  5 Reallocated_Sector_Ct 0x0032 100 100 000 Old_age เสมอ - 0
  9 Power_On_Hours 0x0032 100 100 000 Old_age เสมอ - 10469
 12 Power_Cycle_Count 0x0032 100 100 000 Old_age เสมอ - 8
170 Available_Reservd_Space 0x0033 100 100 010 ล่วงหน้าล้มเหลวเสมอ - 0
171 Program_Fail_Count 0x0032 100 100 000 Old_age เสมอ - 0
172 Erase_Fail_Count 0x0032 100 100 000 Old_age เสมอ - 0
174 Unsafe_Shutdown_Count 0x0032 100 100 000 Old_age เสมอ - 7
175 Power_Loss_Cap_Test 0x0033 100 100 010 Pre-fail เสมอ - 2479 (8 65535)
183 SATA_Downshift_Count 0x0032 100 100 000 Old_age เสมอ - 0
184 End-to-End_Error_Count 0x0033 100 100 090 ผิดพลาดล่วงหน้าเสมอ - 0
187 Uncorrectable_Error_Cnt 0x0032 100 100 000 Old_age เสมอ - 0
190 Drive_Temperature 0x0022 078 073 000 Old_age เสมอ - 22 (ต่ำสุด/สูงสุด 12/29)
192 Unsafe_Shutdown_Count 0x0032 100 100 000 Old_age เสมอ - 7
194 อุณหภูมิ_เซลเซียส 0x0022 100 100 000 Old_age เสมอ - 22
197 Pending_Sector_Count 0x0012 100 100 000 Old_age เสมอ - 0
199 CRC_Error_Count 0x003e 100 100 000 Old_age เสมอ - 0
225 Host_Writes_32MiB 0x0032 100 100 000 Old_age เสมอ - 1064411
226 Workld_Media_Wear_Indic 0x0032 100 100 000 Old_age เสมอ - 440
227 Workld_Host_Reads_Perc 0x0032 100 100 000 Old_age เสมอ - 45
228 Workload_Minutes 0x0032 100 100 000 Old_age เสมอ - 628005
232 Available_Reservd_Space 0x0033 100 100 010 Pre-fail เสมอ - 0
233 Media_Wearout_Indicator 0x0032 100 100 000 Old_age เสมอ - 0
234 Thermal_Throttle_Status 0x0032 100 100 000 Old_age เสมอ - 0/0
235 Power_Loss_Cap_Test 0x0033 100 100 010 Pre-fail เสมอ - 2479 (8 65535)
241 Host_Writes_32MiB 0x0032 100 100 000 Old_age เสมอ - 1064411
242 Host_Reads_32MiB 0x0032 100 100 000 Old_age เสมอ - 876800
243 NAND_Writes_32MiB 0x0032 100 100 000 Old_age เสมอ - 1801020

เวอร์ชันบันทึกข้อผิดพลาด SMART: 1
ไม่มีการบันทึกข้อผิดพลาด
David Pivoňka avatar
us flag
เวอร์ชันเคอร์เนล @anx คือ 5.4.0-92-generic ฉันไม่แน่ใจว่าระบบไฟล์กำลังใช้คุณสมบัติทิ้ง ฉันจะบอกได้อย่างไร เราไม่ได้ตั้งค่าอะไรแบบนั้นระหว่างการติดตั้ง แก้ไข: เพิ่มเนื้อหา /etc/fstab เพื่อโพสต์
Nikita Kipriyanov avatar
za flag
แสดง `lsblk --discard`
David Pivoňka avatar
us flag
@NikitaKipriyanov เพิ่มในโพสต์หลัก
Nikita Kipriyanov avatar
za flag
แล้วคนไหนแสดงพฤติกรรมแบบนี้?
David Pivoňka avatar
us flag
เรากำลังซ่อมแซมโดยใช้ `echo 'repair' >/sys/block/md2/md/sync_action` ดังนั้นควรเป็น `md2 : active raid1 sdb4[1] sda4[0]` ตาม `cat /proc/mdstat`
Nikita Kipriyanov avatar
za flag
น่าเสียดายที่ดัชนี MD เหล่านี้ไม่เสถียร พวกเขาอาจเปลี่ยนหลังจากรีบูต ถึงกระนั้น md2 ยังอยู่ใน sda และ sdb - อุปกรณ์เหล่านั้นคืออะไร? กรุณาแสดง `smartctl` ให้พวกเขา นอกจากนี้ โปรดแสดง `mdadm --detail /dev/md2`
David Pivoňka avatar
us flag
เพิ่มฉันควรบอกด้วยว่าเรามีเซิร์ฟเวอร์สำรองที่เหมือนกันกับเซิร์ฟเวอร์นี้ และปัญหาก็เกิดขึ้นที่นั่นเช่นกัน
Nikita Kipriyanov avatar
za flag
ยินดีที่ได้เห็นข้อมูลเกี่ยวกับ SSD แต่คุณโพสต์ผลลัพธ์ที่เหมือนกันสองรายการ ต่างกันเพียงซีเรียลเท่านั้น เก็บเพียงสำเนาเดียวก็เพียงพอแล้ว ฉันต้องการดูแอตทริบิวต์และบันทึกข้อผิดพลาด `smartctl -A -l error /dev/sd[ab]` // ฉันกลัวว่า MD RAID ไม่ใช่เทคโนโลยีที่ดีที่สุดที่จะใช้กับ SSD เหล่านี้ นี่เป็นกรณีที่ระบบไฟล์ที่มีการจัดการวอลุ่มรวมอาจเหมาะสมกว่า เช่น zfs หรือ btrfs
David Pivoňka avatar
us flag
เพิ่มผลลัพธ์ของข้อผิดพลาด smartctl คุณกำลังบอกว่าอาจช่วยแทนที่ MD RAID ด้วยการโจมตีด้วยฮาร์ดแวร์บางประเภท?
Nikita Kipriyanov avatar
za flag
ฉันพูดตามจริงว่ามันอาจจะดีกว่าที่จะแทนที่ RAID ระดับบล็อกด้วย RAID ระดับระบบไฟล์ ฉันคาดว่า HW RAID จะแสดงอาการที่คล้ายกันหรือแปลกยิ่งกว่านั้น // เราพบปัญหาเช่นนี้ในวันนี้กับ SSD รุ่น S4610 ที่คล้ายกัน ตอนนี้ฉันก็มีปัญหาเหมือนคุณ แต่ในกรณีของฉันมี Windows ที่ไม่มีระบบไฟล์ดังกล่าว ดังนั้นเรากำลังสำรวจ

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา