Score:0

ดิสก์ VMDK กลายเป็นแบบอ่านอย่างเดียว & วิธีหลีกเลี่ยงกรณีเช่นนี้บนเครื่อง rhel

ธง gb

เรามีคาฟคาคลัสเตอร์ที่มี RHEL 7.6 คาฟคาทั้งหมดเป็นเครื่อง VM

บนเครื่อง Kafka เครื่องหนึ่ง เราสังเกตเห็นว่าดิสก์ sdb กลายเป็นแบบอ่านอย่างเดียว (เมื่อ sda เป็นดิสก์ระบบปฏิบัติการ)

 เมานต์ | เกรป เอสดีบี
/dev/sdb บน /var/data/kafka_DB ประเภท ext4 (ro,noatime,data=ordered)

จากมุมมองของฉันมันแปลกเล็กน้อยที่ DISK VMDK กลายเป็นแบบอ่านอย่างเดียว (เพราะไม่ใช่ดิสก์กลไก)

จากหมวกสีแดงฉันพบสิ่งต่อไปนี้

https://access.redhat.com/solutions/1273213

https://access.redhat.com/solutions/35329

แต่ไม่แน่ใจว่าคำแนะนำข้างต้นจาก redhat เป็นคำตอบหรือไม่ว่าทำไมดิสก์จึงกลายเป็นแบบอ่านอย่างเดียว

ความคิดเห็นอื่น ๆ ?

จากบันทึกของเคอร์เนล เราสามารถเห็น:

[1642397.157193] sd 0:0:2:0: [sdb] ผลลัพธ์ล้มเหลว: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
[1642397.157200] sd 0:0:2:0: [sdb] CDB: เขียน (10) 2a 00 12 c0 01 00 00 00 08 00
[1642397.157214] blk_update_request: ข้อผิดพลาด I/O, dev sdb, เซกเตอร์ 314573056
[1642397.157242] ข้อผิดพลาดของบัฟเฟอร์ I/O บน dev sdb, ลอจิคัลบล็อก 39321632, การเขียนหน้า async หายไป
[1642397.157806] sd 0:0:2:0: [sdb] ผลลัพธ์ล้มเหลว: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
[1642397.157808] sd 0:0:2:0: [sdb] CDB: อ่าน (10) 28 00 12 c4 03 58 00 00 08 00
[1642397.157810] blk_update_request: ข้อผิดพลาด I/O, dev sdb, เซกเตอร์ 314835800
[1642397.157843] sd 0:0:2:0: [sdb] ผลลัพธ์ล้มเหลว: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
[1642397.157845] sd 0:0:2:0: [sdb] CDB: อ่าน (10) 28 00 12 c4 0b a0 00 00 08 00
[1642397.157847] blk_update_request: ข้อผิดพลาด I/O, dev sdb, เซกเตอร์ 314837920
[1642578.412306] sd 0:0:2:0: [sdb] ยกเลิกงานบนโฮสต์ 0, ffff8c147c189880
[1642924.513605] sd 0:0:2:0: [sdb] ยกเลิกงานบนโฮสต์ 0, ffff8c16a4f01880
[1643034.935334] JBD2: ตรวจพบข้อผิดพลาด IO ขณะล้างข้อมูลไฟล์บน sdb-8
[1643035.002651] ข้อผิดพลาด EXT4-fs (อุปกรณ์ sdb): __ext4_new_inode:989: comm pool-6-thread-1: ไม่สามารถแทรก inode 8126474: จัดสรรซ้ำซ้อน?
[1643036.753397] การยกเลิก Journal บนอุปกรณ์ sdb-8
[1643036.754490] ข้อผิดพลาด EXT4-fs (อุปกรณ์ sdb): ext4_journal_check_start:56: ตรวจพบสมุดรายวันที่ถูกยกเลิก
[1643036.754496] EXT4-fs (sdb): การต่อเชื่อมระบบไฟล์แบบอ่านอย่างเดียว
[1643226.599854] sd 0:0:2:0: [sdb] ยกเลิกงานบนโฮสต์ 0, ffff8c14a4bd3800
[1694249.598258] EXT4-fs (sdb): จำนวนข้อผิดพลาดตั้งแต่ fsck ล่าสุด: 17
[1694249.598269] EXT4-fs (sdb): ข้อผิดพลาดเริ่มต้น ณ เวลา 1629844995: ext4_find_entry:1312: inode 656236
[1694249.598273] EXT4-fs (sdb): ข้อผิดพลาดล่าสุด ณ เวลา 1630003886: ext4_journal_check_start:56
[1780756.527074] EXT4-fs (sdb): จำนวนข้อผิดพลาดตั้งแต่ fsck ล่าสุด: 17
[1780756.527086] EXT4-fs (sdb): ข้อผิดพลาดเริ่มต้น ณ เวลา 1629844995: ext4_find_entry:1312: inode 656236
[1780756.527088] EXT4-fs (sdb): ข้อผิดพลาดล่าสุด ณ เวลา 1630003886: ext4_journal_check_start:56

สิ่งที่เราคิดจะทำคือการปรับปรุง /sys/บล็อก/ชื่อฐาน /dev/sdb/อุปกรณ์/หมดเวลา

เช่น ค่าเริ่มต้นคือ 180

และเรากำลังคิดที่จะตั้งค่าอัพเดทใหม่เป็น

เสียงสะท้อน 3600 > /sys/block/`basename /dev/sda`/device/timeout

อยากทราบว่าเรามาถูกทางกับแนวทางข้างต้นหรือไม่ ?

Ginnungagap avatar
gu flag
คุณได้ตรวจสอบบันทึกเคอร์เนลของคุณแล้วหรือยัง?
King David avatar
gb flag
ฉันอัปเดตคำถาม
Ginnungagap avatar
gu flag
ฟิสิคัลดิสก์โหลดในช่วงเวลาใด คุณใช้เครื่องมือสำรองเช่น Veeam หรือไม่ ฟิสิคัลดิสก์ถูกเปิดเผยผ่านเครือข่ายไปยัง ESXi หรือไม่
King David avatar
gb flag
เราไม่สามารถเข้าถึงฟิสิคัลดิสก์ได้ ดังนั้นฉันจึงสามารถเก็บข้อมูลนี้ได้ สิ่งที่ฉันอยากทราบว่าคำแนะนำของ redhat สามารถช่วยเราได้หรือไม่
King David avatar
gb flag
เราเกี่ยวข้องกับผู้ดูแลระบบ ESX และเขาบอกว่าเขาไม่เห็นปัญหาใด ๆ จากดิสก์ที่มีอยู่จริงบนที่เก็บข้อมูล

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา