ฉันกำลังทำงานในสภาพแวดล้อมที่มีคลัสเตอร์ NVMeoF ความพร้อมใช้งานสูงแบบฝังอยู่ และต้องการให้คลัสเตอร์นี้พร้อมใช้งานภายในไม่กี่นาทีหลังจากเปิดโหนดทั้งหมดโดยไม่ได้เปิดเครื่อง และพยายามตั้งค่า RAID-10 บนคลัสเตอร์นี้
โครงสร้างพื้นฐานเดิมที่ฉันใช้งานอยู่นั้นใช้ GFS2 และ LVM2 น่าเสียดายที่ตัวเลือก Raid-10 สำหรับ LVM ดูเหมือนจะอนุญาตเพียงหนึ่งวารสารสำหรับ GFS2 เมื่อฉันต้องการมากกว่านี้ ฉันเริ่มทำงานในเส้นทางของการตั้งค่าชุดอาร์เรย์ RAID-1 ด้วย DRBD ด้วยตนเอง ซึ่งฉันสามารถตั้งค่า RAID-0 ด้วย LVM2 ได้ ฉันสามารถตั้งค่านี้ได้โดยไม่มีปัญหามากเกินไป อย่างไรก็ตาม ณ จุดนี้ ฉันพบกับอุปสรรค: ฉันจะปิดและเริ่มสำรองโหนดทั้งหมดได้อย่างไรเพื่อให้การเปลี่ยนข้อมูลเป็นไปอย่างราบรื่น
ความพยายามขั้นพื้นฐานของฉันเริ่มต้นส่งผลให้แต่ละบอร์ดบูตในสถานะที่มีการซิงโครไนซ์ที่ 0% และต้องใช้เวลาหลายชั่วโมงในการซิงค์ใหม่ ฉันใช้คำสั่งต่อไปนี้กับแต่ละโหนดจากสี่โหนดเพื่อพยายามปิดอย่างหมดจด:
vgchange -a n g1 #g1 คือโลจิคัลวอลุ่มที่วางทับฟิสิคัลวอลุ่มของ r0 และ r1
vgchange --lockstop
drbdadm ลง r0 #drbd ทรัพยากรที่กำหนดค่าเป็นฟิสิคัลวอลุ่ม
drbdadm ลง r1 #drbd ทรัพยากรที่กำหนดค่าเป็นฟิสิคัลวอลุ่ม
จากนั้นแต่ละบอร์ดจะถูกหมุนเวียนพลังงาน และฉันพยายามเริ่มต้นการสำรองข้อมูลด้วยคำสั่งต่อไปนี้:
drbdadm ขึ้น r0
drbdadm ขึ้น r1
ถ้า [ `ชื่อโฮสต์` = "โฮสต์ที่เหมาะสม" ]; จากนั้น drbdadm หลัก --force r0; ไฟ
ถ้า [ `ชื่อโฮสต์` = "เหมาะสม-host2" ]; แล้ว drbdadm หลัก --force r1; ไฟ
vgchange --lockstart
vgchange -asy g1
ฉันสังเกตเห็นว่าบางครั้งมันก็ใช้งานได้ บางครั้งฉันได้รับแจ้งว่าข้อมูลเมตาของฉันไม่ถูกต้องและฉันจะต้องสร้างขึ้นใหม่ หลังจากเรียกใช้ drbdadm create-md r0 หรือ r1 การซิงโครไนซ์ผ่าน drbd จะเกิดขึ้นจากจุดเริ่มต้น 0% ซึ่งใช้เวลาหลายชั่วโมง ซึ่งความพยายามของฉันไม่สามารถคงอยู่ได้ ฉันไม่แน่ใจว่าลำดับการเริ่มต้น/ปิดเครื่องที่เฉพาะเจาะจงอาจทำให้ฉันหลีกเลี่ยงข้อกังวลเกี่ยวกับการซิงโครไนซ์ได้อย่างน่าเชื่อถือหรือไม่ หากมีวิธีบังคับให้ DRBD เร่งความพยายามในการซิงโครไนซ์ใหม่ให้เร็วขึ้น หากการสลับเป็นการกำหนดค่า RAID-01 โดยที่ DRBD ถูกซ้อนทับบนสองโลจิคัลวอลุ่มอาจทำให้มั่นใจได้ว่าการกำหนดค่าเริ่มต้นที่เชื่อถือได้มากขึ้น ซึ่งสามารถข้ามการซิงโครไนซ์เริ่มต้นได้ หรือถ้าฉันใช้เครื่องมือที่ไม่ถูกต้องสำหรับงาน
ServerOverflow มีข้อมูลเชิงลึกใด ๆ ที่จะช่วยฉันในการกำหนดค่าของฉันสำหรับการเริ่มต้นและการปิดระบบที่เชื่อถือได้และสะอาดหรือไม่? ความช่วยเหลือใด ๆ ที่จะได้รับการชื่นชมอย่างมาก!