Score:2

การกู้คืนข้อมูลจากอาร์เรย์ Dell MD3220 หลังจากที่ตัวควบคุมทั้งสองมีฐานข้อมูลที่เสียหาย

ธง ve

ฉันพยายามกู้คืนข้อมูลจากอาร์เรย์ที่สร้างขึ้นในหน่วยเก็บข้อมูล Dell MD3220 PowerVault คุยโทรศัพท์กับ Dell และกลุ่มสนับสนุนอื่นๆ เป็นเวลาหลายสัปดาห์แล้ว และกำลังเจอกำแพงอิฐ ฉันหวังว่าใครบางคนที่นี่อาจจะมีความคิดที่ฉันสามารถลองโดยหวังว่าจะกู้คืนข้อมูลได้ อุปกรณ์จัดเก็บข้อมูลมีช่องใส่ไดรฟ์ 24 ช่องที่ระบุด้วยฐาน 0 (ดังนั้น ไดรฟ์ 24 จะเรียกว่า 23 และไดรฟ์ 1 จะเรียกว่า 0)

MD3220 หน้าMD3220 ด้านหลัง

หน่วยประสบปัญหาไฟดับและฉันเดาว่าหน่วยเก็บข้อมูลออฟไลน์ก่อนที่เซิร์ฟเวอร์ทั้งสองจะเข้าถึงข้อมูล (ผ่านสายเคเบิล SAS) เป็นสาเหตุของปัญหา ดังนั้นฐานข้อมูลที่มีการกำหนดค่าอาร์เรย์ที่อยู่บนคอนโทรลเลอร์แต่ละตัวใน MD3220 (มีอยู่สองตัว) จึงเสียหาย

  • เราพยายามกู้คืน DBs โดยแทนที่ DB ปัจจุบันด้วยข้อมูลสำรองล่าสุดที่พบในคอนโทรลเลอร์ (สถานการณ์ทั่วไป) ที่ดูเหมือนจะล้มเหลว

  • เรายังพยายามสร้างฐานข้อมูลใหม่ด้วยไฟล์ที่จัดเก็บไว้ในเซิร์ฟเวอร์ของฉัน (ไฟล์ DBM) ที่ฉันใช้ในการจัดการอุปกรณ์ เราให้ Dell สร้างคีย์ Validator เพื่อใช้เมื่อสร้างฐานข้อมูลใหม่ ที่ดูเหมือนจะล้มเหลวเช่นกัน

ข้อผิดพลาดที่ฉันเห็นอยู่เสมอว่าฉันไม่สามารถหลีกเลี่ยงได้คือ ประเภทข้อยกเว้น ข้อความ N3adp6Device24ExtentAllocatedExceptionE "N3adp6Device24ExtentAllocatedExceptionE" ที่มีขอบเขต:553 ขนาด:1106 สำหรับไดรฟ์ ordinal22.

29/09/21-19:24:37 (tRAID): WARN: UWManager::initializeNvsramIWLog: IWLog ไม่ถูกต้อง
29/09/21-19:24:37 (tRAID): หมายเหตุ: UWMgr findIWLogs: พบไดรฟ์บันทึก IW Devnum 0x10001 ถาด = 0 ช่อง = 2 ssd = 0 qos = 3 ตัวควบคุม = 0
29/09/21-19:24:37 (tRAID): หมายเหตุ: UWMgr findIWLogs: พบไดรฟ์บันทึก IW Devnum 0x10002 ถาด = 0 ช่อง = 3 ssd = 0 qos = 3 ตัวควบคุม = 0
09/29/21-19:24:37 (IWTask): หมายเหตุ: UWMgr: เริ่มการบันทึก IW
29/09/21-19:24:41 (tRAID): ข้อผิดพลาด: CrushDrive::allocateExtent - ประเภทข้อยกเว้น N3adp6Device24ExtentAllocatedExceptionE ข้อความ "N3adp6Device24ExtentAllocatedExceptionE" ที่มีขอบเขต:553 ขนาด:1106 สำหรับไดรฟ์ลำดับที่ 22
29/09/21-19:24:41 (tRAID): ข้อผิดพลาด: CrushStripe DeSerialization - ไม่สามารถจัดสรรขอบเขตได้! CrushDrive 22 เล่ม 1 CrushPiece 2 ขอบเขต 553
29/09/21-19:24:41 (tRAID): ข้อผิดพลาด: ข้อยกเว้นระหว่างการจัดสรรแถบใน vdm::CrushStripePersistenceManager::initialize(1)
09/29/21-19:24:41 (tRAID): ข้อผิดพลาด: vdm::CrushInvalidCfgMgr DB_CORRUPT ตรวจพบ
29/09/21-19:24:41 (tRAID): หมายเหตุ: lockdownPrimaryDBInvalidWorker: OBB อยู่ใน pcache แล้ว ไม่อัปเดต
09/29/21-19:24:41 (tRAID): WARN: BackupDatabaseManager:lockdownPrimaryDBInvalid ยกเว้น IconSendInfeasibleException Error
29/09/21-19:24:41 (tRAID): เตือน: BDBM: ไคลเอ็นต์ตรวจพบความเสียหายของฐานข้อมูลหลัก บังคับให้ dualControllerLockdown
29/09/21-19:24:41 (tRAID): คำเตือน: รีบูต Ctl:
                                รีบูต CompID: 0x407
                                เหตุผลในการรีบูต: 0x11
                                เหตุผลในการรีบูตเพิ่มเติม: 0x2
09/29/21-19:24:41 (tRAID): คำเตือน: รีบูตคอนโทรลเลอร์นี้ทันที

ฉันเดาว่า "ลำดับที่ 22" กำลังพูดถึงไดรฟ์ 23 (จาก 24 ไดรฟ์) ไม่แน่ใจว่ามันบ่นเกี่ยวกับอะไร ไดรฟ์ 23 ไม่ดีหรือไม่ มีฐานข้อมูลในไดรฟ์ทั้งหมดและฐานข้อมูลในไดรฟ์ 23 ไม่ดีหรือไม่ มีวิธีการกู้คืนที่ขับฐานข้อมูลเช่นคัดลอกจากที่อื่นหรือไม่? มันพูดถึงไดรฟ์ 23 ด้วยซ้ำ? ความช่วยเหลือใด ๆ ที่ทุกคนสามารถโยนให้ฉันได้จะมีจำนวนมาก

ขอบคุณ!!

br flag
นั่นเป็นรุ่นอายุ 10 ปี - ฉันประหลาดใจที่ยังคงรองรับอยู่! เมื่อคุณพูดว่าฐานข้อมูล คุณหมายถึงเค้าโครงอาร์เรย์หรือฐานข้อมูลแอปพลิเคชันจริงของคุณ คุณไม่สามารถลบอาร์เรย์ทั้งหมด สร้างอาร์เรย์ใหม่และกู้คืนข้อมูลของคุณจากการสำรองข้อมูลได้หรือไม่
djdomi avatar
za flag
เปิดตั๋วใน Dell หากคุณยังซื้ออยู่
ve flag
@djdomi ไม่แน่ใจว่าจะตอบกลับความคิดเห็นนั้นอย่างไร ในคำถามของฉัน ฉันบอกว่าฉันได้ทำงานกับเดลล์มาหลายสัปดาห์แล้ว ใช่ ฉันมีตั๋วที่ฉันเปิดกับ Dell และ ... ใช่ ฉันซื้อมัน..?
ve flag
@Chopper3 ไม่อยู่ภายใต้สัญญาและเราต้องจ่ายแพงเพื่อให้มีตัวเลือก "การสนับสนุนครั้งเดียว" โดย DB ฉันหมายถึงเค้าโครงอาร์เรย์ Dell เรียกมันว่าฐานข้อมูลบนตัวควบคุม RAID มีบางสิ่งที่ไม่ได้สำรองไว้ ใช่ ฉันทำได้ แต่ฉันจะสูญเสียข้อมูลบางอย่างที่ฉันไม่ต้องการ มันสามารถช่วยฉันประหยัดเวลาในการสร้างใหม่ได้หลายสัปดาห์ ดังนั้นมันจึงคุ้มค่าที่จะพยายามกู้คืน
djdomi avatar
za flag
กล่าวสั้น ๆ ว่าจ่ายการสนับสนุนสำหรับ dell ตราบเท่าที่คุณมีรายการนี้ใช้งานอยู่ เรามีอุปกรณ์ที่คล้ายกันซึ่งพังเนื่องจากตัวควบคุมหยุดทำงาน จุดวิกฤติขั้นสุดท้ายคือ โดยที่ Dell อยู่ข้าง ๆ ทุกอย่างถูกปิดลง ตัวควบคุมตัวสุดท้ายทั้งสองล้มเหลวในช่วงเวลานั้น .... การอัปเดตเฟิร์มแวร์ได้ฟื้นคืนชีพขึ้นมา
Zac67 avatar
ru flag
> เครื่องประสบปัญหาไฟดับ และฉันเดาว่าหน่วยเก็บข้อมูลออฟไลน์ก่อนที่เซิร์ฟเวอร์ทั้งสองจะเข้าถึงข้อมูล (ผ่านสาย SAS) เป็นสาเหตุของปัญหา นั่นคือสิ่งที่คุณ *จริงๆ* จำเป็นต้องป้องกัน กล่องนี้มี PSU สองตัว และอย่างน้อยหนึ่งตัวต้องเชื่อมต่อกับ UPS (หรือทั้งสองตัวกับ UPS ที่แตกต่างกัน) ไฟฟ้าดับอย่างกะทันหันอาจทำให้การตั้งค่า RAID (เช่นกรณีของคุณ) หรือข้อมูลที่จัดเก็บไว้ในอุปกรณ์เสียหายได้ - แม้จะไม่มีเสียง ดังนั้นคุณจะสังเกตเห็นเพียงวัน/สัปดาห์ต่อมาหรืออาจไม่เคยเลย ฉันมี MD3220i ที่ใช้งานหนักมาหลายปีแล้ว และจำได้ว่าเฟิร์มแวร์ดั้งเดิมมีปัญหาเล็กน้อย

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา