nagios Raid_check สำหรับ CiscoC240M5 ใหม่ที่มี Cisco 12G Modular Raid Controller SAS3516 ล้มเหลว
สำหรับตอนนี้ ฉันได้แก้ไข check_raid ให้ข้ามส่วนตรวจสอบวอลุ่ม โดยตรวจสอบเฉพาะฟิสิคัลไดรฟ์ แต่ตามหลักแล้วเราต้องการตรวจสอบทั้งสองส่วนด้วย check_raid มีใครพบวิธีแก้ไขปัญหานี้หรือไม่? หรือฉันควรละทิ้ง check_raid และใช้สคริปต์ตัวตัดคำสำหรับ megaclisas-status --nagios แทนโดยยอมรับปัญหา (เครื่องสำอาง) กับตัวเลขขนาดไดรฟ์เสมือน
ออนบอร์ด 14 ดิสก์
- 2*480 GB Micron_5300_MTFDDAK480TDS ใน RAID1
- 12*8T TOSHIBA MG06SCA800A ใน RAID10 ซึ่ง 2 ตัวเป็นอะไหล่สำรอง
ข้อผิดพลาด:
สำคัญ: megacli:[Volumes(2): DISK0.0:,DISK1.1:; อุปกรณ์ (14): 00,11=Hotspare 03,09,06,12,05,01,08,10,07,04,13,02=ออนไลน์]
กลายเป็นข้อมูลที่ขาดหายไปจากคำสั่ง megacli:
# /usr/sbin/megacli -LdInfo -Lall -aall
อะแดปเตอร์ 0 -- ข้อมูลไดรฟ์เสมือน:
ไดรฟ์เสมือน: 0 (รหัสเป้าหมาย: 0)
ไดรฟ์เสมือน: 1 (รหัสเป้าหมาย: 1)
รหัสทางออก: 0x00
เคล็ดลับจากเพื่อนผู้ใช้ที่จะใช้
# /usr/sbin/megacli ShowSummary -Aall
เผยปัญหาอื่น ดิสก์ Toshiba MG06SCA800A 8T มีรายงานความจุ 931.436 GB ส่งผลให้ยอดรวมของไดรฟ์เสมือนลดลงเช่นกัน 4T รายงานแทน 36T
[...]
ตัวเชื่อมต่อ : พอร์ต 12 - 15<ภายใน>: สล็อต 6
รหัสผู้ขาย : TOSHIBA
รหัสสินค้า : MG06SCA800A
รัฐ : ออนไลน์
ประเภทดิสก์ : SAS, อุปกรณ์ฮาร์ดดิสก์
ความจุ : 931.436 GB
สถานะพลังงาน : ใช้งานอยู่
ดิสก์:
ไดรฟ์เสมือน : รหัสเป้าหมาย 1 ชื่อ VD RAID10_12345678
ขนาด : 4.547 TB
สถานะ: ดีที่สุด
ระดับการโจมตี : 10
เช่นเดียวกับ megaclisas-status เนื่องจากใช้ megacli ข้อมูลดิสก์ถูกต้อง แต่ไม่มีข้อมูลอาร์เรย์:
#สถานะ megaclisas --nagios
RAID ตกลง - อาร์เรย์: ตกลง:2 ไม่ดี:0 - ดิสก์: ตกลง:14 ไม่ดี:0
# megaclisas สถานะ
-- ข้อมูลผู้ควบคุม --
-- รหัส | รุ่น H/W | แรม | อุณหภูมิ | บีบียู | เฟิร์มแวร์
c0 | Cisco 12G Modular Raid Controller พร้อมแคช 2GB (สูงสุด 16 ไดรฟ์) | 2048MB | 67C | ดี | FW: 51.10.0-3612
-- ข้อมูลอาร์เรย์ --
-- รหัส | พิมพ์ | ขนาด | Strpsz | ธง | DskCache | สถานะ | เส้นทางระบบปฏิบัติการ | CacheCade | กำลังดำเนินการ
c0u0 | ไม่มี | | | | ไม่มี | ไม่มี | /dev/sda | ไม่มี | ไม่มี
c0u1 | ไม่มี | | | | ไม่มี | ไม่มี | /dev/sdb | ไม่มี | ไม่มี
-- ข้อมูลดิสก์ --
-- รหัส | พิมพ์ | รุ่นไดรฟ์ | ขนาด | สถานะ | ความเร็ว | อุณหภูมิ | รหัสสล็อต | รหัส LSI
c0u0p0 | SSD | 202529BD123BMicron_5300_MTTFDDAK480TDS D3MC000 | 446.1 Gb | ออนไลน์, ปั่นขึ้น | 6.0Gb/s | 31C | [134:13] | 13
c0u0p1 | SSD | 202529BCC1C0Micron_5300_MTTFDDAK480TDS D3MC000 | 446.1 Gb | ออนไลน์, ปั่นขึ้น | 6.0Gb/s | 32C | [134:14] | 2
c0u1p0 | ฮาร์ดดิสก์ | โตชิบา MG06SCA800A 5701Z020A0FSFRJG | 7.276 TB | ออนไลน์, ปั่นขึ้น | 12.0Gb/s | 26C | [134:1] | 3
c0u1p1 | ฮาร์ดดิสก์ | โตชิบา MG06SCA800A 5701Z020A05RFRJG | 7.276 TB | ออนไลน์, ปั่นขึ้น | 12.0Gb/s | 26C | [134:2] | 9
c0u1p0 | ฮาร์ดดิสก์ | TOSHIBA MG06SCA800A 5701Z020A0FRFRJG | โตชิบา 7.276 TB | ออนไลน์, ปั่นขึ้น | 12.0Gb/s | 27C | [134:3] | 6
c0u1p1 | ฮาร์ดดิสก์ | โตชิบา MG06SCA800A 5701Z020A0E7FRJG | 7.276 TB | ออนไลน์, ปั่นขึ้น | 12.0Gb/s | 26C | [134:4] | 12
c0u1p0 | ฮาร์ดดิสก์ | โตชิบา MG06SCA800A 5701Z020A05UFRJG | 7.276 TB | ออนไลน์, ปั่นขึ้น | 12.0Gb/s | 26C | [134:5] | 5
c0u1p1 | ฮาร์ดดิสก์ | โตชิบา MG06SCA800A 5701Z020A052FRJG | 7.276 TB | ออนไลน์, ปั่นขึ้น | 12.0Gb/s | 26C | [134:6] | 1
c0u1p0 | ฮาร์ดดิสก์ | TOSHIBA MG06SCA800A 5701Z020A0EGFRJG | โตชิบา 7.276 TB | ออนไลน์, ปั่นขึ้น | 12.0Gb/s | 26C | [134:7] | 8
c0u1p1 | ฮาร์ดดิสก์ | โตชิบา MG06SCA800A 5701Z020A0FEFRJG | 7.276 TB | ออนไลน์, ปั่นขึ้น | 12.0Gb/s | 26C | [134:8] | 10
c0u1p0 | ฮาร์ดดิสก์ | TOSHIBA MG06SCA800A 5701Z020A04AFRJG | โตชิบา 7.276 TB | ออนไลน์, ปั่นขึ้น | 12.0Gb/s | 26C | [134:9] | 7
c0u1p1 | ฮาร์ดดิสก์ | TOSHIBA MG06SCA800A 5701Z020A0KGFRJG | โตชิบา 7.276 TB | ออนไลน์, ปั่นขึ้น | 12.0Gb/s | 26C | [134:10] | 4
-- ข้อมูลดิสก์ที่ไม่ได้กำหนดค่า --
-- รหัส | พิมพ์ | รุ่นไดรฟ์ | ขนาด | สถานะ | ความเร็ว | อุณหภูมิ | รหัสสล็อต | รหัส LSI | เส้นทาง
c0uXpY | ฮาร์ดดิสก์ | TOSHIBA MG06SCA800A 5701Z020A0EFFRJG | โตชิบา 7.276 TB | Hotspare ปั่นลง | 12.0Gb/s | 26C | [134:11] | 0 | ไม่มีข้อมูล
c0uXpY | ฮาร์ดดิสก์ | TOSHIBA MG06SCA800A 5701Z020A0DRFRJG | โตชิบา 7.276 TB | Hotspare ปั่นลง | 12.0Gb/s | 26C | [134:12] | 11 | ไม่มีข้อมูล
storcli แสดงตัวเลขที่ถูกต้องจริง ๆ แต่ไม่ได้อยู่ใน repo hwraid.le-vert.net ดังนั้นมันจึงเกินขอบเขต