Score:3

e2fsck ล้างระบบไฟล์และหลังจากนั้นไม่กี่นาที (หลังจากอ่านจำนวนมาก) มีข้อผิดพลาด

ธง us

ระบบไฟล์อยู่บน LVM RAID5 ดูเหมือนว่าจะทำงานได้อย่างถูกต้อง:

$ sudo pvs
[sudo] รหัสผ่านสำหรับ jrwren: 
  PV VG Fmt Attr PSize Pฟรี 
  /dev/sda2 datavg lvm2 a-- <7.28t 2.80t
  /dev/sdb2 datavg lvm2 a-- <3.64t 0 
  /dev/sdc2 datavg lvm2 a-- <7.28t <7.28t
  /dev/sdd2 datavg lvm2 a-- <7.28t 0 
  /dev/sde2 datavg lvm2 a-- <7.28t 73.82g
  /dev/sdf1 datavg lvm2 a-- <3.64t 0 
  /dev/sdg2 datavg lvm2 a-- <7.28t 3.99t
  /dev/sdh2 datavg lvm2 a-- <447.11g 8.00m
  /dev/sdi2 datavg lvm2 a-- <9.10t 2.21t
 $ sudo เลเวล
  LV VG Attr LSize Pool Origin Data% Meta% Move Log Cpy%Sync Convert
  lxd2 datavg -wi-ao---- 147.10g                                                    
  มิเรอร์ datavg -wi-ao---- 300.00g                                                    
  m datavg Rwi-aor--- 3.52t 100.00          
  m3 datavg Rwi-aor--- 4.00t 100.00          
  mu datavg Rwi-aor--- 1.00t 100.00          
  nomirror datavg -wi-ao---- 2.20t                                                    
  รูปภาพ datavg Rwi-aor--- 200.00g 100.00          
  stor datavg Rwi-aor--- 300.00g 100.00          
  storj datavg -wi-ao---- 1.00t                                                    
  t datavg Rwi-aor--- 6.00t 100.00          
  t2 datavg Rwi-aor--- 3.90t 100.00     

ฉันมีกระบวนการอ่านจำนวนมากบนโลจิคัลวอลุ่มชื่อ m นี่คืออุปกรณ์ dm-12 ในที่สุดมันก็ตายด้วยข้อความเคอร์เนลต่อไปนี้

30 มิ.ย. 16:02:33 น. เคอร์เนลล่าช้า: [393661.035286] ข้อผิดพลาด EXT4-fs (อุปกรณ์ dm-12): ext4_find_extent:885: inode #191365192: com[68/1946]t main: pblk 765519712 ส่วนหัว / ขอบเขตไม่ถูกต้อง: เวทมนตร์ไม่ถูกต้อง - มายากล 0 รายการ 0 สูงสุด 0(0) ความลึก 0(0)                               
30 มิถุนายน 16:02:33 น. เคอร์เนลล่าช้า: [393661.039726] ข้อผิดพลาด EXT4-fs (อุปกรณ์ dm-12): ext4_find_extent:885: inode #191365192: comm rtorrent main: pblk 765519712 ส่วนหัว / ขอบเขตไม่ถูกต้อง: เวทมนตร์ไม่ถูกต้อง - เวทมนตร์ 0 รายการ 0, สูงสุด 0(0), ความลึก 0(0)                               
30 มิ.ย. 16:02:33 น. เคอร์เนลล่าช้า: [393661.044175] ข้อผิดพลาด EXT4-fs (อุปกรณ์ dm-12): ext4_find_extent:885: inode #191365192: comm rtorrent main: pblk 765519712 ส่วนหัว / ขอบเขตไม่ถูกต้อง: เวทมนตร์ไม่ถูกต้อง - เวทมนตร์ 0 รายการ 0, สูงสุด 0(0), ความลึก 0(0)                               
30 มิ.ย. 16:02:33 น. เคอร์เนลล่าช้า: [393661.048584] ข้อผิดพลาด EXT4-fs (อุปกรณ์ dm-12): ext4_find_extent:885: inode #191365192: comm rtorrent main: pblk 765519712 ส่วนหัว / ขอบเขตไม่ถูกต้อง: เวทมนตร์ไม่ถูกต้อง - เวทมนตร์ 0 รายการ 0, สูงสุด 0(0), ความลึก 0(0) 
30 มิถุนายน 16:02:33 เคอร์เนลล่าช้า: [393661.054717] ข้อผิดพลาด EXT4-fs (อุปกรณ์ dm-12): ext4_find_extent:885: inode #191365192: comm rtorrent main: pblk 765519712 ส่วนหัว / ขอบเขตไม่ถูกต้อง: เวทมนตร์ไม่ถูกต้อง - เวทมนตร์ 0 รายการ 0, สูงสุด 0(0), ความลึก 0(0) 
30 มิ.ย. 16:02:33 น. เคอร์เนลล่าช้า: [393661.060977] ข้อผิดพลาด EXT4-fs (อุปกรณ์ dm-12): ext4_find_extent:885: inode #191365192: comm rtorrent main: pblk 765519712 ส่วนหัว / ขอบเขตไม่ถูกต้อง: เวทมนตร์ไม่ถูกต้อง - เวทมนตร์ 0 รายการ 0, สูงสุด 0(0), ความลึก 0(0) 
30 มิ.ย. 16:02:33 น. เคอร์เนลล่าช้า: [393661.063736] ข้อผิดพลาด EXT4-fs (อุปกรณ์ dm-12): ext4_find_extent:885: inode #191365192: comm rtorrent main: pblk 765519712 ส่วนหัว / ขอบเขตไม่ถูกต้อง: เวทมนตร์ไม่ถูกต้อง - เวทมนตร์ 0 รายการ 0, สูงสุด 0(0), ความลึก 0(0) 
30 มิ.ย. 16:02:33 น. เคอร์เนลล่าช้า: [393661.066283] ข้อผิดพลาด EXT4-fs (อุปกรณ์ dm-12): ext4_find_extent:885: inode #191365192: comm rtorrent main: pblk 765519712 ส่วนหัว / ขอบเขตไม่ถูกต้อง: เวทมนตร์ไม่ถูกต้อง - เวทมนตร์ 0 รายการ 0, สูงสุด 0(0), ความลึก 0(0) 
30 มิ.ย. 16:02:33 น. เคอร์เนลล่าช้า: [393661.068773] ข้อผิดพลาด EXT4-fs (อุปกรณ์ dm-12): ext4_find_extent:885: inode #191365192: comm rtorrent main: pblk 765519712 ส่วนหัว / ขอบเขตไม่ถูกต้อง: เวทมนตร์ไม่ถูกต้อง - เวทมนตร์ 0 รายการ 0, สูงสุด 0(0), ความลึก 0(0) 
30 มิ.ย. 16:02:33 น. เคอร์เนลล่าช้า: [393661.071232] ข้อผิดพลาด EXT4-fs (อุปกรณ์ dm-12): ext4_find_extent:885: inode #191365192: comm rtorrent main: pblk 765519712 ส่วนหัว / ขอบเขตไม่ถูกต้อง: เวทมนตร์ไม่ถูกต้อง - เวทมนตร์ 0 รายการ 0, สูงสุด 0(0), ความลึก 0(0) 

ฉันยกเลิกการต่อเชื่อมระบบไฟล์และเรียกใช้ e2fsck:

$ sudo e2fsck -p /dev/datavg/m
ภาพยนตร์มีระบบไฟล์ที่มีข้อผิดพลาด บังคับให้ตรวจสอบ
ภาพยนตร์: Inode 118751237 มีโหนดขอบเขตที่ไม่ถูกต้อง (blk 475078659, lblk 0)


ภาพยนตร์: ความไม่ลงรอยกันที่ไม่คาดคิด; เรียกใช้ fsck ด้วยตนเอง
        (เช่น ไม่มีตัวเลือก -a หรือ -p)
$ sudo e2fsck -y /dev/datavg/movies
e2fsck 1.45.7 (28-ม.ค.-2564)
ภาพยนตร์มีระบบไฟล์ที่มีข้อผิดพลาด บังคับให้ตรวจสอบ
ผ่าน 1: ตรวจสอบไอโหนด บล็อก และขนาด
Inode 177471496 มีโหนดขอบเขตที่ไม่ถูกต้อง (blk 709943175, lblk 0)
ชัดเจน? ใช่
...

ผ่าน 1E: การปรับขอบเขตต้นไม้ให้เหมาะสม
ผ่าน 2: การตรวจสอบโครงสร้างไดเร็กทอรี
ผ่าน 3: ตรวจสอบการเชื่อมต่อไดเร็กทอรี
ผ่าน 4: ตรวจสอบจำนวนอ้างอิง
ผ่าน 5: ตรวจสอบข้อมูลสรุปของกลุ่ม
Block bitmap differences:  -(709943175--709943176) -(868210688--868212735) -(868214784--868216831) -(868253696--868255743) -(868257792--868259839) -(868886528--868888575) -(868892672- -868894719) -(868896768--868898815) -(868900864--868902911) -(868904960--868907007) -(868909056--868911103) -(868913152--868917247) -(868921344--868923391) -(868925440-- 868927487) -(868929536--868931583) -(868933632--868935679) -(868937728--868939775) -(868941824--868943871) -(868945920--868947967) -(868950016--868954111) -(868958208--868960013 ) -(869894144--869922573)
แก้ไข? ใช่

บล็อคฟรีนับผิดกลุ่ม #21665 (24561, count=24563)
แก้ไข? ใช่

บล็อกฟรีนับผิดสำหรับกลุ่ม #26495 (28672, นับ=32768)
แก้ไข? ใช่

บล็อกฟรีนับผิดสำหรับกลุ่ม #26497 (18432, นับ=22528)
แก้ไข? ใช่

บล็อกฟรีนับผิดสำหรับกลุ่ม #26516 (22528, นับ=32768)
แก้ไข? ใช่

บล็อกฟรีนับผิดสำหรับกลุ่ม #26517 (16384, นับ=32768)
แก้ไข? ใช่

บล็อกฟรีนับผิดสำหรับกลุ่ม #26518 (16626, นับ=26624)
แก้ไข? ใช่

บล็อคฟรีนับผิดกลุ่ม #26547 (2290, count=30720)
แก้ไข? ใช่

บล็อคฟรีนับผิด (366951912, count=367025158)
แก้ไข? ใช่



ภาพยนตร์: ***** ระบบไฟล์ถูกดัดแปลง *****
ภาพยนตร์: 6896/236224512 ไฟล์ (20.8% ไม่ติดกัน), 577868794/944893952 บล็อก
$ sudo e2fsck -p /dev/datavg/movies
ภาพยนตร์: สะอาด, 6896/236224512 ไฟล์, 577868794/944893952 บล็อก

มันบอกว่ามันสะอาด ดังนั้นฉันจึงติดตั้งใหม่และรันซอฟต์แวร์การอ่านอีกครั้ง

และไม่กี่นาทีต่อมา:

30 มิ.ย. 16:34:49 น. เคอร์เนลล่าช้า: [395595.309814] ข้อผิดพลาด EXT4-fs (อุปกรณ์ dm-12): ext4_find_extent:885: inode #191365190: comm rtorrent main: pblk 765517692 ส่วนหัว / ขอบเขตไม่ถูกต้อง: เวทมนตร์ไม่ถูกต้อง - เวทมนตร์ 0 รายการ 0, สูงสุด 0(0), ความลึก 0(0) 
30 มิถุนายน 16:34:49 เคอร์เนลล่าช้า: [395595.317838] ข้อผิดพลาด EXT4-fs (อุปกรณ์ dm-12): ext4_find_extent:885: inode #191365190: comm rtorrent main: pblk 765517692 ส่วนหัว / ขอบเขตไม่ถูกต้อง: เวทมนตร์ไม่ถูกต้อง - เวทมนตร์ 0 รายการ 0, สูงสุด 0(0), ความลึก 0(0) 
30 มิถุนายน 16:34:49 เคอร์เนลล่าช้า: [395595.320836] ข้อผิดพลาด EXT4-fs (อุปกรณ์ dm-12): ext4_find_extent:885: inode #191365190: comm rtorrent main: pblk 765517692 ส่วนหัว / ขอบเขตไม่ถูกต้อง: เวทมนตร์ไม่ถูกต้อง - เวทมนตร์ 0 รายการ 0, สูงสุด 0(0), ความลึก 0(0) 
30 มิถุนายน 16:34:49 เคอร์เนลล่าช้า: [395595.323418] ข้อผิดพลาด EXT4-fs (อุปกรณ์ dm-12): ext4_find_extent:885: inode #191365190: comm rtorrent main: pblk 765517692 ส่วนหัว / ขอบเขตไม่ถูกต้อง: เวทมนตร์ไม่ถูกต้อง - เวทมนตร์ 0 รายการ 0, สูงสุด 0(0), ความลึก 0(0) 
30 มิถุนายน 16:35:14 เคอร์เนลล่าช้า: [395619.785771] ข้อผิดพลาด EXT4-fs (อุปกรณ์ dm-12): ext4_find_extent:885: inode #191365190: comm rtorrent main: pblk 765517692 ส่วนหัว / ขอบเขตไม่ถูกต้อง: เวทมนตร์ไม่ถูกต้อง - เวทมนตร์ 0 รายการ 0, สูงสุด 0(0), ความลึก 0(0) 
30 มิถุนายน 16:35:14 เคอร์เนลล่าช้า: [395619.793135] ข้อผิดพลาด EXT4-fs (อุปกรณ์ dm-12): ext4_find_extent:885: inode #191365190: comm rtorrent main: pblk 765517692 ส่วนหัว / ขอบเขตไม่ถูกต้อง: เวทมนตร์ไม่ถูกต้อง - เวทมนตร์ 0 รายการ 0, สูงสุด 0(0), ความลึก 0(0) 

เกิดขึ้นที่นี่คืออะไร? LVM ทุจริตและโกหกฉันหรือไม่? มีคำสั่งที่ฉันสามารถตรวจสอบได้หรือไม่? ฉันควรรันบล็อกเสีย (e2fsck -c) หรืออะไรไหม

ไม่มีข้อความ LVM ที่สอดคล้องกันจากเคอร์เนล ฉันคาดว่าจะมีข้อผิดพลาด LVM หากดิสก์พื้นฐานมีปัญหา เกิดอะไรขึ้น?

อัปเดต: มีคนขอเอาต์พุต dmesg นั่นคือสิ่งที่อยู่เหนือข้อความ EXT4-fs ข้อความอื่น ๆ ในเอาต์พุต dmesg นอกเหนือจากข้อความบูตมาตรฐานเท่านั้นที่ทำซ้ำ:

[527724.593062] rptaddrs [3948921]: Segfault ที่ 7FFC7A7A50B5 IP 00007FD9F0F86820 SP 00007FC7A7A7A3FC8 17 c0 c5 f8 77 c3 48 39 f7 0f 87 ab 00 00 00 0f 84 e5 fe ff ff c5 fe 6f 26 <c5> fe 6f 6c 16 e0 c5 fe 6f 74 16 c0 c5 fe 6f 7c 16 a0 c5 7e 6f 44
shodanshok avatar
ca flag
โปรดแสดงผลของ `dmesg`
jrwren avatar
us flag
@shodanshok ฉันทำ ข้อผิดพลาดของเคอร์เนลอยู่ที่นั่น ฉันจะอัปเดตด้วย rptaddrs segfaults
Score:3
ธง cn

สิ่งนี้เกิดขึ้นกับฉันสองครั้ง สาเหตุเกิดจากความผิดพลาดของฮาร์ดแวร์ สาเหตุที่เป็นไปได้:

  • สายเคเบิลที่เชื่อมต่อไม่ดี
  • สายเคเบิลดิสก์เสีย (เกิดขึ้นกับฉันครั้งเดียว)
  • อินเทอร์เฟซ SATA บั๊กกี้ (ฉันมีอินเทอร์เฟซที่เขียนบล็อกศูนย์ไบต์ลงในอุปกรณ์ดิสก์ของฉันเพียงครั้งเดียว แต่จากนั้นฉันก็ทิ้งการ์ดนั้น)
  • RAM ไม่ดี (ข้อมูลบัฟเฟอร์เสียหาย)
  • ความร้อนสูงเกินไปหรือข้อผิดพลาดที่เกิดจากการโอเวอร์คล็อก
  • มีโอกาสน้อยกว่าความผิดพลาดของฮาร์ดแวร์อื่น ๆ

ทั้งสองครั้งนี้เกิดขึ้นกับฉัน ฉันประสบปัญหาข้อมูลสูญหาย ทุกวันนี้มีโอกาสน้อยลงมาก เพราะฉันใช้ ZFS กับสแน็ปช็อตที่จำลองและยังมีการสำรองข้อมูลเทปแบบออฟไลน์ด้วย

ความจริงที่ว่าคุณสามารถ fsck แล้วพบว่าล้มเหลวอีกครั้งในทันทีหลังจากนั้นทำให้ฉันเชื่อว่ามันเป็นปัญหาของฮาร์ดแวร์ บล็อกที่เขียนโดย fsck ไปยังดิสก์เมื่อ "แก้ไข" ปัญหาอาจไม่ได้ (เสมอ) ทำให้พื้นผิวดิสก์ไม่เสียหาย ฉันคาดการณ์

ก่อนอื่น ตรวจสอบให้แน่ใจว่าสายเคเบิลที่มีอยู่ของคุณเข้าที่อย่างถูกต้องและทดสอบใหม่อีกครั้ง หากไม่สามารถแก้ไขปัญหาได้ โปรดอ่านต่อ:

คุณอาจพิสูจน์ได้ว่านี่คือปัญหา ด้วยดิสก์ทดสอบ:

  1. รับอิมเมจระบบที่สามารถบู๊ตได้เช่น ในไดรฟ์ USB อย่าเตรียมสิ่งนี้ในเครื่องที่เสีย เพราะมันอาจจะเสียหายได้ ใช้เครื่องอื่นหรือซื้อแท่ง USB ระบบ Linux สำเร็จรูป
  2. ปิดระบบ
  3. ติดป้ายกำกับว่าฮาร์ดดิสก์ทุกตัวเชื่อมต่อกับอินเทอร์เฟซ SATA อย่างไร (เช่น พอร์ตใด เป็นต้น)
  4. ถอดไดรฟ์ออกและจัดเก็บอย่างถูกต้อง (เช่น ในภาชนะป้องกันไฟฟ้าสถิตย์ที่ทนทาน) อย่าเสียบกลับเข้าไปในระบบจนกว่าคุณจะแยกและแก้ไขปัญหาได้ เนื่องจากความพยายามของคุณในการแก้ไขปัญหาด้วย ฟค กำลังทำให้มันแย่ลง
  5. เสียบปลั๊ก เสียสละ ดิสก์ที่มี ไม่มีข้อมูลที่มีค่าที่คุณสามารถเขียนทับได้อย่างปลอดภัย
  6. ตรวจสอบอีกครั้งว่าดิสก์เสียสละและอิมเมจที่สามารถบู๊ตได้ (ดูรายการถัดไป) เท่านั้น อุปกรณ์เก็บข้อมูลที่เชื่อมต่อกับเครื่อง คุณต้องหลีกเลี่ยงการแบ่งพาร์ติชันดิสก์ที่มีข้อมูลอันมีค่าของคุณบนดิสก์โดยไม่ตั้งใจหรือเรียกใช้ บล็อกที่ไม่ดี บนดิสก์ดังกล่าว
  7. บูตจากอิมเมจระบบสด (เช่น ระบบสด USB ที่สามารถบู๊ตได้)
  8. แบ่งพาร์ติชั่นไดรฟ์เป็นพาร์ติชั่นจำนวนเล็กน้อย พาร์ติชั่นแรกมีขนาดไม่กี่สิบ GB
  9. วิ่ง บล็อกเสีย -w -B (ที่ -บี ตรวจสอบให้แน่ใจว่าเราใช้ RAM ด้วย) บนพาร์ติชันขนาดเล็ก (เลือกอันเล็กเพื่อไม่ให้การทดสอบใช้เวลาหลายวัน)
  10. หากล้มเหลว แสดงว่าคุณมีปัญหาเกี่ยวกับฮาร์ดแวร์ ลองเปลี่ยนส่วนประกอบเพื่อดูว่าปัญหาหายไปหรือไม่
    1. ตัวอย่างเช่น นำโมดูล RAM ทั้งหมดออก ยกเว้นโมดูลเดียว หมุนดูเพื่อดูว่าโมดูลใดเสีย
    2. ตัวอย่างเช่น เปลี่ยนพอร์ต SATA ที่คุณเชื่อมต่อเพื่อระบุอินเทอร์เฟซหรืออะแดปเตอร์ SATA ที่ไม่ดี
    3. ตัวอย่างเช่น ใช้พอร์ต SATA เดิมแต่เปลี่ยนสาย เพื่อระบุสายที่เสีย
  11. เป็นไปได้ว่าข้อบกพร่องในส่วนประกอบอื่นๆ ของระบบ (แม้แต่เมนบอร์ดที่ชำรุดหรือ PSU ที่จ่ายไฟน้อยเกินไป) อาจทำให้เกิดปัญหาได้
  12. หากคุณสงสัยว่า RAM ไม่ดี คุณสามารถใช้ memtest86 เพื่อทดสอบ คุณยังสามารถละเว้น -บี แฟล็กจากแบดบล็อกเพื่อใช้ I/O โดยตรงแทน ซึ่งจะลดแต่ไม่ลดการใช้แรม

เมื่อคุณระบุฮาร์ดแวร์ที่ผิดพลาดได้แล้ว ให้เปลี่ยนใหม่ ตามหลักการแล้ว ให้กู้คืนข้อมูลสำรองล่าสุดของคุณไปยังดิสก์ใหม่ (โปรดสังเกตว่าหากคุณไม่ได้แยกและแก้ไขปัญหาจริง ๆ ข้อมูลในดิสก์ใหม่ของคุณจะเสียหายด้วย)

แก้ไข: คุณสามารถลงคะแนนได้ แต่หากคุณตัดสินใจทำเช่นนั้น ฉันจะขอบคุณหากคุณจะแสดงความคิดเห็นที่ระบุว่าเหตุใดคำตอบนี้จึงไม่มีประโยชน์

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา