เรามีคาฟคาคลัสเตอร์ที่มี RHEL 7.6 คาฟคาทั้งหมดเป็นเครื่อง VM
บนเครื่อง Kafka เครื่องหนึ่ง เราสังเกตเห็นว่าดิสก์ sdb กลายเป็นแบบอ่านอย่างเดียว (เมื่อ sda เป็นดิสก์ระบบปฏิบัติการ)
เมานต์ | เกรป เอสดีบี
/dev/sdb บน /var/data/kafka_DB ประเภท ext4 (ro,noatime,data=ordered)
จากมุมมองของฉันมันแปลกเล็กน้อยที่ DISK VMDK กลายเป็นแบบอ่านอย่างเดียว (เพราะไม่ใช่ดิสก์กลไก)
จากหมวกสีแดงฉันพบสิ่งต่อไปนี้
https://access.redhat.com/solutions/1273213
https://access.redhat.com/solutions/35329
แต่ไม่แน่ใจว่าคำแนะนำข้างต้นจาก redhat เป็นคำตอบหรือไม่ว่าทำไมดิสก์จึงกลายเป็นแบบอ่านอย่างเดียว
ความคิดเห็นอื่น ๆ ?
จากบันทึกของเคอร์เนล เราสามารถเห็น:
[1642397.157193] sd 0:0:2:0: [sdb] ผลลัพธ์ล้มเหลว: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
[1642397.157200] sd 0:0:2:0: [sdb] CDB: เขียน (10) 2a 00 12 c0 01 00 00 00 08 00
[1642397.157214] blk_update_request: ข้อผิดพลาด I/O, dev sdb, เซกเตอร์ 314573056
[1642397.157242] ข้อผิดพลาดของบัฟเฟอร์ I/O บน dev sdb, ลอจิคัลบล็อก 39321632, การเขียนหน้า async หายไป
[1642397.157806] sd 0:0:2:0: [sdb] ผลลัพธ์ล้มเหลว: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
[1642397.157808] sd 0:0:2:0: [sdb] CDB: อ่าน (10) 28 00 12 c4 03 58 00 00 08 00
[1642397.157810] blk_update_request: ข้อผิดพลาด I/O, dev sdb, เซกเตอร์ 314835800
[1642397.157843] sd 0:0:2:0: [sdb] ผลลัพธ์ล้มเหลว: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
[1642397.157845] sd 0:0:2:0: [sdb] CDB: อ่าน (10) 28 00 12 c4 0b a0 00 00 08 00
[1642397.157847] blk_update_request: ข้อผิดพลาด I/O, dev sdb, เซกเตอร์ 314837920
[1642578.412306] sd 0:0:2:0: [sdb] ยกเลิกงานบนโฮสต์ 0, ffff8c147c189880
[1642924.513605] sd 0:0:2:0: [sdb] ยกเลิกงานบนโฮสต์ 0, ffff8c16a4f01880
[1643034.935334] JBD2: ตรวจพบข้อผิดพลาด IO ขณะล้างข้อมูลไฟล์บน sdb-8
[1643035.002651] ข้อผิดพลาด EXT4-fs (อุปกรณ์ sdb): __ext4_new_inode:989: comm pool-6-thread-1: ไม่สามารถแทรก inode 8126474: จัดสรรซ้ำซ้อน?
[1643036.753397] การยกเลิก Journal บนอุปกรณ์ sdb-8
[1643036.754490] ข้อผิดพลาด EXT4-fs (อุปกรณ์ sdb): ext4_journal_check_start:56: ตรวจพบสมุดรายวันที่ถูกยกเลิก
[1643036.754496] EXT4-fs (sdb): การต่อเชื่อมระบบไฟล์แบบอ่านอย่างเดียว
[1643226.599854] sd 0:0:2:0: [sdb] ยกเลิกงานบนโฮสต์ 0, ffff8c14a4bd3800
[1694249.598258] EXT4-fs (sdb): จำนวนข้อผิดพลาดตั้งแต่ fsck ล่าสุด: 17
[1694249.598269] EXT4-fs (sdb): ข้อผิดพลาดเริ่มต้น ณ เวลา 1629844995: ext4_find_entry:1312: inode 656236
[1694249.598273] EXT4-fs (sdb): ข้อผิดพลาดล่าสุด ณ เวลา 1630003886: ext4_journal_check_start:56
[1780756.527074] EXT4-fs (sdb): จำนวนข้อผิดพลาดตั้งแต่ fsck ล่าสุด: 17
[1780756.527086] EXT4-fs (sdb): ข้อผิดพลาดเริ่มต้น ณ เวลา 1629844995: ext4_find_entry:1312: inode 656236
[1780756.527088] EXT4-fs (sdb): ข้อผิดพลาดล่าสุด ณ เวลา 1630003886: ext4_journal_check_start:56
สิ่งที่เราคิดจะทำคือการปรับปรุง /sys/บล็อก/
ชื่อฐาน /dev/sdb/อุปกรณ์/หมดเวลา
เช่น ค่าเริ่มต้นคือ 180
และเรากำลังคิดที่จะตั้งค่าอัพเดทใหม่เป็น
เสียงสะท้อน 3600 > /sys/block/`basename /dev/sda`/device/timeout
อยากทราบว่าเรามาถูกทางกับแนวทางข้างต้นหรือไม่ ?