Score:0

การกู้คืน RAID1 หลังจากการย่อยสลาย

ธง ye

ด้านล่างนี้เป็นเอาต์พุตจาก lsblk, mdadm และ /proc/mdstat สำหรับอาร์เรย์ Raid1 ดิสก์ 2 ตัวของฉัน

anand@ironman:~$ lsblk 
ชื่อ MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
sda 8:0 0 465.8G 0 ดิสก์  
|-sda1 8:1 0 976M 0 ส่วน  
| `-md0 9:0 0 975.4M 0 จู่โจม1 
| `-vg_boot-boot (dm-6) 253:6 0 972M 0 lvm /บูต
`-sda2 8:2 0 464.8G 0 ส่วน  
sdb 8:16 0 465.8G 0 ดิสก์  
|-sdb1 8:17 0 976M 0 ส่วน  
`-sdb2 8:18 0 464.8G 0 ส่วน  
  `-md1 9:1 0 464.7G 0 จู่โจม1 
    |-vg00-root (dm-0) 253:0 0 93.1G 0 lvm /
    |-vg00-บ้าน (dm-1) 253:1 0 96.6G 0 lvm /บ้าน
    |-vg00-var (dm-2) 253:2 0 46.6G 0 lvm /var
    |-vg00-usr (dm-3) 253:3 0 46.6G 0 lvm /usr
    |-vg00-swap1 (dm-4) 253:4 0 7.5G 0 lvm [สลับ]
    `-vg00-tmp (dm-5) 253:5 0 952M 0 lvm /tmp

anand@ironman:~$ cat /proc/mdstat
บุคลิก : [จู่โจม1] 
md1 : ใช้งานการจู่โจม 1 sdb2[1]
      487253824 บล็อกซุปเปอร์ 1.2 [2/1] [_U]
      
md0 : ใช้งาน Raid1 sda1[0]
      998848 บล็อกซุปเปอร์ 1.2 [2/1] [U_]
      
อุปกรณ์ที่ไม่ได้ใช้: <ไม่มี>

anand@ironman:~$ sudo mdadm -D /dev/md0 /dev/md1
/dev/md0:
        เวอร์ชัน : 1.2
  เวลาสร้างสรรค์ : วันพุธที่ 22 พฤษภาคม 21:00:35 น. 2556
     ระดับการจู่โจม : การจู่โจม1
     ขนาดอาร์เรย์ : 998848 (975.60 MiB 1022.82 MB)
  ขนาด Dev ที่ใช้ : 998848 (975.60 MiB 1022.82 MB)
   อุปกรณ์จู่โจม : 2
  อุปกรณ์ทั้งหมด : 1
    การคงอยู่: Superblock นั้นคงอยู่

    Update Time : พฤ. 21 ต.ค. 14:35:36 น. 2564
          สถานะ : สะอาด เสื่อมโทรม 
 อุปกรณ์ที่ใช้งาน : 1
อุปกรณ์การทำงาน : 1
 อุปกรณ์ที่ล้มเหลว : 0
  อุปกรณ์สำรอง : 0

           ชื่อ : ironman:0 (ท้องถิ่นโฮสต์ไอรอนแมน)
           UUID : cbcb9fb6:f7727516:9328d30a:0a970c9b
         เหตุการณ์ : 4415

    หมายเลขหลักรอง RaidDevice สถานะ
       0 8 1 0 การซิงค์ที่ใช้งานอยู่ /dev/sda1
       1 0 0 1 ลบออก
/dev/md1:
        เวอร์ชัน : 1.2
  เวลาที่สร้างสรรค์ : วันพุธที่ 22 พฤษภาคม 21:00:47 น. 2556
     ระดับการจู่โจม : การจู่โจม1
     ขนาดอาร์เรย์ : 487253824 (464.68 GiB 498.95 GB)
  ขนาด Dev ที่ใช้ : 487253824 (464.68 GiB 498.95 GB)
   อุปกรณ์จู่โจม : 2
  อุปกรณ์ทั้งหมด : 1
    การคงอยู่: Superblock นั้นคงอยู่

    Update Time : พฤ. 21 ต.ค. 14:35:45 น. 2564
          สถานะ : สะอาด เสื่อมโทรม 
 อุปกรณ์ที่ใช้งาน : 1
อุปกรณ์การทำงาน : 1
 อุปกรณ์ที่ล้มเหลว : 0
  อุปกรณ์สำรอง : 0

           ชื่อ : ironman:1 (ท้องถิ่นโฮสต์ไอรอนแมน)
           UUID : 3f64c0ce:fcb9ff92:d5fd68d7:844b7e12
         เหตุการณ์ : 63025777

    หมายเลขหลักรอง RaidDevice สถานะ
       0 0 0 0 ลบออก
       1 8 18 1 การซิงค์ที่ใช้งานอยู่ /dev/sdb2

คำสั่งที่จะใช้ในการกู้คืนจากความล้มเหลวของ Raid1 คืออะไร

ฉันต้องซื้อฮาร์ดไดรฟ์ใหม่หรือไม่เพื่อประกอบ Raid1 อีกครั้งอย่างปลอดภัย ติดตั้ง?

อัปเดต 1:

    anand@ironman:~$ sudo smartctl -H /dev/sda 
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.2.0-4-amd64] (รุ่นในเครื่อง)
ลิขสิทธิ์ (C) 2002-11 โดย Bruce Allen, http://smartmontools.sourceforge.net

=== จุดเริ่มต้นของการอ่านข้อมูลสมาร์ทส่วน ===
ผลการทดสอบการประเมินตนเองด้านสุขภาพโดยรวมของ SMART: ผ่าน
โปรดทราบแอตทริบิวต์ส่วนเพิ่มต่อไปนี้:
ID# ATTRIBUTE_NAME ค่าสถานะ ค่าสถานะ ประเภทที่แย่ที่สุด อัปเดตเมื่อ RAW_VALUE ล้มเหลว
190 Airflow_Temperature_Cel 0x0022 054 040 045 Old_age เสมอใน_the_past 46 (0 174 46 28)

anand@ironman:~$ sudo smartctl -H /dev/sdb
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.2.0-4-amd64] (รุ่นในเครื่อง)
ลิขสิทธิ์ (C) 2002-11 โดย Bruce Allen, http://smartmontools.sourceforge.net

=== จุดเริ่มต้นของการอ่านข้อมูลสมาร์ทส่วน ===
ผลการทดสอบการประเมินตนเองด้านสุขภาพโดยรวมของ SMART: ผ่าน

anand@ironman:~$ 

ข้อมูล S.M.A.R.T:

เอาต์พุตจาก smartctl -a -d ata /dev/sda เอาต์พุตจาก smartctl -a -d ata /dev/sdb

อัปเดต 2:

anand@ironman:~$ sudo blkid -o รายการ
UUID ป้ายติดป้าย fs_type ของอุปกรณ์
--------------------------------------------- --------------------------------------------- --------------------------------------------- -
/dev/sda1 linux_raid_member ironman:0 (ใช้งานอยู่) cbcb9fb6-f772-7516-9328-d30a0a970c9b
/dev/sda2 linux_raid_member ironman:1 (ไม่ได้ติดตั้ง) 3f64c0ce-fcb9-ff92-d5fd-68d7844b7e12
/dev/sdb1 linux_raid_member ironman:0 (ไม่ได้ติดตั้ง) cbcb9fb6-f772-7516-9328-d30a0a970c9b
/dev/sdb2 linux_raid_member ironman:1 (ใช้งานอยู่) 3f64c0ce-fcb9-ff92-d5fd-68d7844b7e12
/dev/md0 LVM2_member (ใช้งานอยู่) JKI3Lr-VdDK-Ogsk-KOQk-jSKJ-udAV-Vt4ckP
/dev/md1 LVM2_member (ใช้งานอยู่) CAqW3D-WJ7g-2lbw-G3cn-nidp-2jdQ-evFe7r
/dev/mapper/vg00-root ext4 รูท / 82334ff8-3eff-4fc7-9b86-b11eeda314ae
/dev/mapper/vg00-บ้าน ext4 บ้าน /บ้าน 8e9f74dd-08e4-45a3-a492-d4eaf22a1d68
/dev/mapper/vg00-var ext4 var /var 0e798199-3219-458d-81b8-b94a5736f1be
/dev/mapper/vg00-usr ext4 usr /usr d8a335fc-72e6-4b98-985e-65cff08c4e22
/dev/mapper/vg00-swap1 สลับ <swap> b95ee4ca-fcca-487f-b6ff-d6c0d49426d8
/dev/mapper/vg00-tmp ext4 tmp /tmp c879fae8-bd25-431d-be3e-6120d0381cb8
/dev/mapper/vg_boot-boot ext4 บูต /บูต 12684df6-6c4a-450f-8ed1-d3149609a149

-- จบการอัพเดท 2

อัปเดต 3 - หลังจากทำตามคำแนะนำของ Nikita:

/dev/md0:                                                                           
        เวอร์ชัน : 1.2 â                                                                           
  Creation Time : พุธ 22 พฤษภาคม 21:00:35 2013 â                                                                           
     ระดับการจู่โจม : การจู่โจม 1 â                                                                           
     ขนาดอาร์เรย์ : 998848 (975.60 MiB 1022.82 MB) â                                                                           
  ขนาด Dev ที่ใช้ : 998848 (975.60 MiB 1022.82 MB) â                                                                           
   อุปกรณ์จู่โจม : 2 â                                                                           
  อุปกรณ์ทั้งหมด : 2 â                                                                           
    การคงอยู่ : Superblock จะคงอยู่ â                                                                           
                                                                            â                                                                           
    อัปเดตเวลา : ศ. 22 ต.ค. 21:20:09 น. 2021 â                                                                           
          สถานะ : สะอาด â                                                                           
 อุปกรณ์ที่ใช้งาน : 2 â                                                                           
อุปกรณ์การทำงาน : 2 â                                                                           
 อุปกรณ์ที่ล้มเหลว : 0 â                                                                           
  อุปกรณ์สำรอง : 0 â                                                                           
                                                                            â                                                                           
           ชื่อ : ironman:0 (ท้องถิ่นโฮสต์ไอรอนแมน) â                                                                           
           UUID : cbcb9fb6:f7727516:9328d30a:0a970c9b â                                                                           
         เหตุการณ์ : 4478 â                                                                           
                                                                            â                                                                           
    หมายเลขหลัก ผู้เยาว์ RaidDevice สถานะ â                                                                           
       0 8 1 0 การซิงค์ที่ใช้งานอยู่ /dev/sda1 â                                                                           
       2 8 17 1 การซิงค์ที่ใช้งานอยู่ /dev/sdb1   



anand@ironman:~/.scripts/automatem/bkp$ sudo mdadm -D /dev/md1 â                                                                           
/dev/md1:                                                                           
        เวอร์ชัน : 1.2 â                                                                           
  Creation Time : พุธ 22 พฤษภาคม 21:00:47 2013 â                                                                           
     ระดับการจู่โจม : การจู่โจม 1 â                                                                           
     ขนาดอาร์เรย์ : 487253824 (464.68 GiB 498.95 GB) â                                                                           
  ขนาด Dev ที่ใช้ : 487253824 (464.68 GiB 498.95 GB) â                                                                           
   อุปกรณ์จู่โจม : 2 â                                                                           
  อุปกรณ์ทั้งหมด : 2 â                                                                           
    การคงอยู่ : Superblock จะคงอยู่ â                                                                           
                                                                            â                                                                           
    อัพเดทเวลา : ศ. 22 ต.ค. 21:21:37 น. 2021 â                                                                           
          สถานะ : สะอาด â                                                                           
 อุปกรณ์ที่ใช้งาน : 2 â                                                                           
อุปกรณ์การทำงาน : 2 â                                                                           
 อุปกรณ์ที่ล้มเหลว : 0 â                                                                           
  อุปกรณ์สำรอง : 0 â                                                                           
                                                                            â                                                                           
           ชื่อ : ironman:1 (ท้องถิ่นโฮสต์ไอรอนแมน) â                                                                           
           UUID : 3f64c0ce:fcb9ff92:d5fd68d7:844b7e12 â                                                                           
         เหตุการณ์ : 63038935 â                                                                           
                                                                            â                                                                           
    หมายเลขหลัก ผู้เยาว์ RaidDevice สถานะ â                                                                           
       2 8 18 0 แอคทีฟซิงค์ /dev/sdb2 â                                                                           
       1 8 34 1 แอคทีฟซิงค์ /dev/sdc2 

ขอบคุณทุกคน!

อานันท์

Nikita Kipriyanov avatar
za flag
คุณเข้ามาในสถานะนี้ได้อย่างไร? ดู `dmesg` ตรวจสอบ S.M.A.R.T. ของอุปกรณ์ทั้งสอง ใช่ ต้องดำเนินการ แต่ฉันสงสัยว่าสิ่งใด
ye flag
ฉันได้อัปเดตข้อมูล S.M.A.R.T.
Nikita Kipriyanov avatar
za flag
ฉันจะไม่เชื่อถือคำตัดสินของดิสก์ โปรดพิจารณา `smarctl -A` นอกจากนี้ `blkid` เพื่อตรวจสอบว่ามันเห็นโครงสร้างใด ๆ ใน `/dev/sda2` และ `/dev/sdb1` (ตอนนี้ไม่ได้ใช้งาน แต่ดูเหมือนว่าสิ่งเหล่านั้นควรเป็นขาที่สองของ RAID1-s)
ye flag
เพิ่มเอาต์พุตรายการ blkid -o ขออภัยเข้าใจผิดคำสั่ง ฉันจะอัปเดตเร็ว ๆ นี้
Score:1
ธง za

ดูเหมือนว่าดิสก์ทั้งสองของคุณกำลังจะตาย:

/dev/sda:
  4 Start_Stop_Count 0x0032 096 096 020 Old_age เสมอ - 5039
  5 Reallocated_Sector_Ct 0x0033 100 100 036 ล้มเหลวล่วงหน้าเสมอ - 240
187 Reported_Uncorrect 0x0032 079 079 000 Old_age เสมอ - 21
195 Hardware_ECC_Recovered 0x001a 044 015 000 Old_age เสมอ - 26908616

/dev/sdb:
  4 Start_Stop_Count 0x0012 099 099 000 Old_age เสมอ - 4911
  5 Reallocated_Sector_Ct 0x0033 088 088 005 ล้มเหลวล่วงหน้าเสมอ - 90
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age เสมอ - 114
197 Current_Pending_Sector 0x0022 001 001 000 Old_age เสมอ - 9640

ดังนั้น ย้ำอีกครั้งว่าอย่าเชื่อในสิ่งที่มันพูดเกี่ยวกับตัวมันเอง มันโกหก!

คุณต้องเชื่อมต่อก ที่สาม ดิสก์ แบ่งพาร์ติชันและเพิ่มลงใน RAID ของคุณ รอจนกว่าจะสร้างใหม่เสร็จ ติดตั้ง bootloader ที่นั่น จากนั้นลบทั้งสองที่ล้มเหลวและเชื่อมต่อ ประการที่สี่ หนึ่งและทำซ้ำอีกครั้งเพื่อเรียกคืนความซ้ำซ้อน

และตั้งค่าการตรวจสอบและติดตามเป็นระยะเพื่อหลีกเลี่ยงสถานการณ์ที่อันตรายเช่นนี้ในอนาคต


เป็นเรื่องน่าประหลาดใจที่เห็นอาร์เรย์ RAID สำหรับบู๊ตแยกต่างหากที่มี LVM อยู่ ผิดปกติมาก จุดประสงค์ดั้งเดิมของพาร์ติชันสำหรับเริ่มระบบแยกต่างหากคือการไม่ใส่ไว้ใน LVM เพื่อให้เข้าถึงได้ง่ายขึ้น ( bootloader รุ่นแรก ๆ ไม่รู้อะไรเลยเกี่ยวกับ LVM ดังนั้นจึงเป็นข้อกำหนด)

ye flag
โอเค ขอบคุณสำหรับข้อมูลของคุณ ฉันจะอัปเดตเมื่อทำตามขั้นตอนที่คุณแนะนำเสร็จแล้ว
ye flag
ใส่ไดรฟ์ใหม่ คัดลอกตารางพาร์ติชันจากไดรฟ์อื่นโดยใช้ sfdisk จากนั้นเพิ่มพาร์ติชันที่สร้างขึ้นใหม่ลงในทั้ง md0 และ md1 และการกู้คืนเสร็จสมบูรณ์ ตอนนี้รอไดรฟ์ใหม่ถัดไปเพื่อทำตามขั้นตอน ขอขอบคุณ!
ye flag
ด้วยความอยากรู้อยากเห็น ฉันสามารถลองเพิ่มพาร์ติชันที่ถูกลบ /dev/sda2 และ /dev/sdc1 (เดิมคือ /dev/sdb1) ไปยังอาร์เรย์การโจมตีได้หรือไม่ อะไรจะเกิดขึ้น?
Nikita Kipriyanov avatar
za flag
คุณสามารถเล่นกับฮาร์ดดิสก์เก่าได้มากเท่าที่คุณต้องการ สิ่งเดียวที่ฉันแนะนำคืออย่าเล่นกับอาร์เรย์ "การผลิต" เพราะความอยากรู้อยากเห็น เพื่อให้สร้างอาร์เรย์ใหม่จากดิสก์เก่าเหล่านี้ได้ดีขึ้นและเน้นย้ำเพื่อดูว่าจะทำงานอย่างไรภายใต้การโหลด แม้ว่าจะแสดงข้อผิดพลาดหรือตาย ข้อมูลของคุณจะปลอดภัยในดิสก์ใหม่
ye flag
ขอบคุณสำหรับคำแนะนำของคุณ

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา