ฉันกำลังทดสอบอาร์เรย์ RAID10 ที่นี่ด้วย mdadm ฉันต้องการดูจำนวนอุปกรณ์ที่ล้มเหลวที่มันสามารถทนได้ เวลาสร้างใหม่ ฯลฯ มีอยู่ช่วงหนึ่งที่ฉันให้มันซิงค์ซ้ำกับอุปกรณ์ 5 หรือ 6 เครื่อง จากนั้นฉันก็รีบูตเครื่อง ตอนนี้มันแสดงว่าไม่ทำงานและฉันไม่แน่ใจว่ามันคืออะไร กำลังดำเนินการหรือทำอย่างไรจึงจะได้คืน
ไม่มีอะไรสำคัญในนั้นและฉันสามารถสร้างมันขึ้นมาใหม่ได้ แต่ฉันต้องการทราบว่าเกิดข้อผิดพลาดอะไรขึ้นและจะสามารถกู้คืนได้หรือไม่
root@netcu1257-vs-02:~# cat /proc/mdstat บุคลิก : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0 : ไม่ทำงาน sdz[19] sdy[ 18] sdx[17] sdw[16] sdv[15] sdu[14] sds[12] sdt[13] sdr[11] sdq[10](S) sdp[21] sdn[8] sdm[7] sdo [9] sdl[6] sdj[20](R) sdk[22](S) sdi[4](S) sdh[3] sdf[1] sde[0] sdg[2]
257812572160 บล็อค super 1.2.1
root@netcu1257-vs-02:~# mdadm -D /dev/md0
/dev/md0:
เวอร์ชัน : 1.2
เวลาสร้าง : ศ. 29 ต.ค. 13:59:41 น. 2564
ระดับการจู่โจม : การจู่โจม 10
ขนาด Dev ที่ใช้ : 18446744073709551615
อุปกรณ์จู่โจม : 20
รวมอุปกรณ์ : 22
การคงอยู่: Superblock นั้นคงอยู่
อัปเดตเวลา : จันทร์ที่ 8 พ.ย. 09:59:42 น. 2564
สถานะ: ใช้งานอยู่ ล้มเหลว ยังไม่เริ่ม
อุปกรณ์ที่ใช้งานอยู่ : 13
อุปกรณ์การทำงาน : 22
อุปกรณ์ที่ล้มเหลว : 0
อุปกรณ์สำรอง : 9
รูปแบบ : ใกล้=2
ขนาดก้อน : 512K
นโยบายความสอดคล้อง : ไม่ทราบ
ชื่อ : netcu1257-vs-02:0 (ภายในเครื่องโฮสต์ netcu1257-vs-02)
UUID : c3418360:4fb5857c:eb952018:163a60c6
เหตุการณ์ : 85985
หมายเลขหลักรอง RaidDevice สถานะ
- ลบ 0 0 0
- 0 0 1 ลบออก
- 0 0 2 ลบออก
- 0 0 3 ลบออก
- 0 0 4 ลบออก
- 0 0 5 ลบออก
- 0 0 6 ลบออก
- 0 0 7 ลบออก
- 0 0 8 ลบออก
- ลบ 0 0 9
- 0 0 10 ลบออก
- 0 0 11 ลบออก
- 0 0 12 ลบออก
- 0 0 13 ลบออก
- 0 0 14 ลบออก
- 0 0 15 ลบออก
- 0 0 16 ลบออก
- ลบ 0 0 17
- ลบ 0 0 18
- ลบ 0 0 19
- 65 112 17 sync set-B /dev/sdx
- 8 64 0 การสร้างใหม่สำรอง /dev/sde
- 8 208 8 ซิงค์ set-A /dev/sdn
- 65 80 15 ซิงค์ set-B /dev/sdv
- 8 176 6 ซิงค์ set-A /dev/sdl
- 65 48 13 ซิงค์ set-B /dev/sdt
- 8 144 5 การสร้างใหม่สำรอง /dev/sdj
- 65 16 11 ซิงค์ set-B /dev/sdr
- 8 112 3 ซิงค์ set-B /dev/sdh
- การสร้างใหม่สำรอง 8 240 7 /dev/sdp
- 65 128 18 ซิงค์ set-A /dev/sdy
- 8 80 1 ซิงค์ set-B /dev/sdf
- 8 224 9 การสร้างใหม่สำรอง /dev/sdo
- 65 96 16 ซิงค์ set-A /dev/sdw
- 8 192 10 การสร้างใหม่สำรอง /dev/sdm
- 65 64 14 ซิงค์ set-A /dev/sdu
- 8 160 - สำรอง /dev/sdk
- 65 32 12 ซิงค์ set-A /dev/sds
- 8 128 - สำรอง /dev/sdi
- 65 0 - สำรอง /dev/sdq
- 65 144 19 ซิงค์ set-B /dev/sdz
- 8 96 2 การสร้างใหม่สำรอง /dev/sdg
อย่างที่คุณเห็น อุปกรณ์ทั้งหมดของฉัน (/dev/sd[e-z]) แสดงเป็นส่วนหนึ่งของ md0 แต่ก็ยังแสดงอุปกรณ์ที่หายไป 20 เครื่อง รูปแบบดั้งเดิมของอาร์เรย์คืออุปกรณ์ 20 ชิ้นพร้อมอะไหล่ 2 ชิ้น และในขณะที่แจ้งว่ากำลังสร้างใหม่ ก็ไม่มีกิจกรรมของดิสก์ และ /proc/mdstat ก็บ่งชี้เช่นเดียวกัน
กู้คืนได้หรือไม่? และเนื่องจากอาร์เรย์กำลังสร้างใหม่ก่อนที่จะรีบูตโฮสต์ ฉันจะทำอย่างไรเพื่อให้แน่ใจว่าการสร้างใหม่จะดำเนินต่อไปและอาร์เรย์ยังคงทำงานอยู่หลังจากรีบูต
แก้ไข:
ฉันพบว่าไฟล์ mdadm.conf ของฉันถูกวางไว้อย่างไม่ถูกต้องใน /etc/ ฉันย้ายไปที่ /etc/mdadm/ และรีบูต ตอนนี้อาร์เรย์ของฉันแสดงเป็น RAID0 ซึ่งยังไม่ใช้งาน:
root@netcu1257-vs-02:~# mdadm -D /dev/md0
/dev/md0:
เวอร์ชัน : 1.2
ระดับการจู่โจม : การจู่โจม 0
รวมอุปกรณ์ : 22
การคงอยู่: Superblock นั้นคงอยู่
สถานะ: ไม่ได้ใช้งาน
อุปกรณ์การทำงาน : 22
ชื่อ : netcu1257-vs-02:0 (ภายในเครื่องโฮสต์ netcu1257-vs-02)
UUID : c3418360:4fb5857c:eb952018:163a60c6
เหตุการณ์ : 85985
Number Major Minor RaidDevice
- 65 112 - /dev/sdx
- 8 64 - /dev/sde
- 8 208 - /dev/sdn
- 65 80 - /dev/sdv
- 8 176 - /dev/sdl
- 65 48 - /dev/sdt
- 8 144 - /dev/sdj
- 65 16 - /dev/sdr
- 8 112 - /dev/sdh
- 8 240 - /dev/sdp
- 65 128 - /dev/sdy
- 8 80 - /dev/sdf
- 8 224 - /dev/sdo
- 65 96 - /dev/sdw
- 8 192 - /dev/sdm
- 65 64 - /dev/sdu
- 8 160 - /dev/sdk
- 65 32 - /dev/sds
- 8 128 - /dev/sdi
- 65 0 - /dev/sdq
- 65 144 - /dev/sdz
- 8 96 - /dev/sdg