ฉันมีพูล ZFS ในสถานะปัจจุบัน:
[root@SERVER-abc ~]# สถานะ zpool -v DATAPOOL
พูล: DATAPOOL
สถานะ: เสื่อมโทรม
สถานะ: อุปกรณ์อย่างน้อยหนึ่งเครื่องพบข้อผิดพลาดที่ส่งผลให้ข้อมูล
คอรัปชั่น. แอปพลิเคชันอาจได้รับผลกระทบ
การดำเนินการ: กู้คืนไฟล์ที่มีปัญหาหากเป็นไปได้ มิฉะนั้นให้คืนค่า
พูลทั้งหมดจากการสำรองข้อมูล
ดู: https://openzfs.github.io/openzfs-docs/msg/ZFS-8000-8A
scan: resilvered 18.5M in 00:00:01 with 0 error on Wed 5 Jan 19:10:50 2022
การกำหนดค่า: `
ชื่อ รัฐ อ่าน เขียน CKSUM
DATAPOOL ลดลง 0 0 0
Raidz2-0 ลดลง 0 0 0
gptid/14c707c6-f16c-11e8-b117-0cc47a2ba44e ลดลง 0 0 17 มีข้อผิดพลาดมากเกินไป
อะไหล่-1 ออนไลน์ 0 0 17
gptid/168342c5-f16c-11e8-b117-0cc47a2ba44e ออนไลน์ 0 0 0
gptid/1bfaa607-f16c-11e8-b117-0cc47a2ba44e ออนไลน์ 0 0 0
gptid/1875501a-f16c-11e8-b117-0cc47a2ba44e ออนไลน์ 0 0 30
gptid/1a16d37c-f16c-11e8-b117-0cc47a2ba44e ออนไลน์ 0 0 29
อะไหล่
gptid/1bfaa607-f16c-11e8-b117-0cc47a2ba44e INUSE กำลังใช้งานอยู่
ข้อผิดพลาด: ตรวจพบข้อผิดพลาดถาวรในไฟล์ต่อไปนี้:
DATAPOOL/VMS/ubuntu_1804_LTS_ustrich-m6i87@auto-2022-01-04_11-41:<0x1>
<0x1080a>:<0x1>
<0x182a>:<0x1>
DATAPOOL/VMS/ubuntu_1804_LTS_ustrich-m6i87:<0x1>
<0x16fa>:<0x1>
นี่คือ zpool ที่มีไดรฟ์สำรอง 4 + 1 มีบางอย่างเกิดขึ้นและจู่ๆ อะไหล่ก็จับคู่โดยอัตโนมัติกับไดรฟ์อื่นเป็นอะไหล่ 1
สิ่งนี้เป็นสิ่งที่ไม่คาดคิดสำหรับฉัน เช่น:
- เหตุใดอะไหล่จึงไม่เปลี่ยนไดรฟ์ที่เสื่อมสภาพ
- จะทราบได้อย่างไรว่าทำไมอะไหล่ถึงเพิ่มขึ้นเป็นอะไหล่ -1
- เป็นไปได้ไหม (หรือแม้กระทั่งแนะนำ/เป็นไปได้) ที่จะขอรับอะไหล่กลับคืนแล้วเปลี่ยนไดรฟ์ที่เสื่อมสภาพ?
เป้าหมายคือการช่วยเหลือพูลโดยไม่ต้องรับข้อมูลจำนวนมากจากการสำรองข้อมูล แต่โดยพื้นฐานแล้วฉันต้องการเข้าใจว่าเกิดอะไรขึ้นและทำไม และวิธีรับมือกับสถานการณ์เหล่านั้น ตาม 'แนวทางปฏิบัติที่ดีที่สุด'
ตังค์เยอะ! :)
ระบบคือ: SuperMicro, TrueNAS-12.0-U4.1, zfs-2.0.4-3
แก้ไข: เปลี่ยนเอาต์พุตจากสถานะ zpool -x เป็นสถานะ zpool -v DATAPOOL
แก้ไข 2: ณ ตอนนี้ฉันเข้าใจว่า 168342c5 ตัวแรกดูเหมือนจะมีข้อผิดพลาดและอะไหล่ (1bfaa607) ก็เพิ่มขึ้น หลังจากนั้น 14c707c6 ก็ลดระดับลงเช่นกัน
แก้ไข 3 คำถามเพิ่มเติม: เนื่องจากไดรฟ์ทั้งหมด (ยกเว้นไดรฟ์สำรอง -1) ดูเหมือนจะมีข้อผิดพลาด CKSUM - นั่นบ่งบอกอะไร เดินสาย? เอชบีเอ? ไดรฟ์ทั้งหมดกำลังจะตายพร้อมกัน?
อัปเดตล่าสุดหลังจาก zpool ชัดเจน
และ zpool สครับ DATAPOOL
ดูเหมือนจะชัดเจนว่าเกิดขึ้นมากมายและไม่มีวิธีใดที่จะช่วยเหลือสระได้:
พูล: DATAPOOL
สถานะ: เสื่อมโทรม
สถานะ: อุปกรณ์อย่างน้อยหนึ่งเครื่องกำลังถูก Resilvered สระว่ายน้ำจะ
ทำงานต่อไปได้อาจอยู่ในสภาพเสื่อมโทรม
การกระทำ: รอให้ resilver เสร็จสิ้น
สแกน: อยู่ระหว่างดำเนินการตั้งแต่ พฤ. 6 ม.ค. 16:18:05 น. 2565
1.82T สแกนที่ 1.55G/s, 204G ออกที่ 174M/s, รวม 7.82T
สีเงิน 40.8G เสร็จ 2.55% เหลือ 12:44:33
การกำหนดค่า:
ชื่อ รัฐ อ่าน เขียน CKSUM
DATAPOOL ลดลง 0 0 0
Raidz2-0 ลดลง 0 0 0
gptid/14c707c6-f16c-11e8-b117-0cc47a2ba44e ลดลง 0 0 156 มีข้อผิดพลาดมากเกินไป
อะไหล่-1 เสื่อมสภาพ 0 0 0
gptid/168342c5-f16c-11e8-b117-0cc47a2ba44e ลดลง 0 0 236 มีข้อผิดพลาดมากเกินไป
gptid/1bfaa607-f16c-11e8-b117-0cc47a2ba44e ออนไลน์ 0 0 0 (สีเงิน)
gptid/1875501a-f16c-11e8-b117-0cc47a2ba44e ลดลง 0 0 182 มีข้อผิดพลาดมากเกินไป
gptid/1a16d37c-f16c-11e8-b117-0cc47a2ba44e ลดลง 0 0 179 มีข้อผิดพลาดมากเกินไป
อะไหล่
gptid/1bfaa607-f16c-11e8-b117-0cc47a2ba44e INUSE กำลังใช้งานอยู่
ฉันจะตรวจสอบสถิติอัจฉริยะทั้งหมดทันที