Score:0

Ubuntu Server 20.04 ค้างทุกสองสามวัน

ธง br

บทนำสั้น ๆ

ตั้งแต่สองสามวันมานี้ เซิร์ฟเวอร์จริงของฉันหยุดทำงานทุกๆ 2 หรือ 3 วัน ฉันได้เปลี่ยนฮาร์ดแวร์ทั้งหมดแล้ว รวมทั้งไดรฟ์ และติดตั้ง Ubuntu ใหม่

รายละเอียดและข้อค้นพบ

ไม่มีโชคเมื่อค้นหาไฟล์บันทึก:

  • ทุกไฟล์บันทึก syslog หรือเคอร์เนลแสดง ^@^@^@^@^@^@^@^@^@^@^@^@ ในช่วงเวลาของการแช่แข็ง ก่อนหน้านั้นไม่มีพฤติกรรมที่น่าสงสัยเป็นเวลาอย่างน้อย 15 นาที ก่อนเวลาอายัด
  • สามารถพบบันทึกรายการบันทึกจากการรีบูตครั้งล่าสุด ที่นี่. ตั้งแต่ฉันใช้ UFW มันค่อนข้างยุ่งเหยิง เดอะ การแช่แข็งเกิดขึ้นเมื่อประมาณ 09:45น.
  • ฉันมีเซิร์ฟเวอร์ในการตรวจสอบของฉัน ไม่มีการเพิ่มขึ้นของ CPU, RAM, DiskIO, พื้นที่ดิสก์หรือการรับส่งข้อมูลบนอินเทอร์เฟซเครือข่ายไม่นานก่อนที่จะเกิดการหยุดทำงาน CPU, RAM และพื้นที่ดิสก์ก็ไม่เกินขีดจำกัดเช่นกัน
  • เมื่อเซิร์ฟเวอร์หยุดทำงาน ฉันไม่สามารถทำอะไรกับคอนโซลได้อีกต่อไป ฉันต้องรีบูตเซิร์ฟเวอร์ (ฮาร์ดรีเซ็ต) เพื่อให้กลับมาทำงานได้สองสามวัน
สิ่งที่ฉันทำงานบนเซิร์ฟเวอร์:
  • จิงซ์
  • php-fpm
  • ลาราเวล 8
  • ufw
  • ล้มเหลว 2 แบน
  • มายเอสคิวแอล 8
การดำเนินการที่ฉันได้ทำไปแล้ว พบในโพสต์ที่คล้ายกัน:
  • ปรับ RAM ฟรีขั้นต่ำ:
    • sysctl -w vm.min_free_kbytes=235929
    • sysctl -w vm.swappiness=5

เนื่องจากบันทึกส่วนใหญ่แสดงสัญญาณแบบสุ่ม ฉันขอขอบคุณสำหรับความช่วยเหลือในสิ่งที่ต้องทำต่อไป ฉันไม่รู้ว่ามีอะไรอีกบ้างที่ฉันสามารถตรวจสอบได้ ขอบคุณสำหรับคำแนะนำและความช่วยเหลือที่มีให้!

Score:1
ธง id
  1. ลองใช้เคอร์เนลเวอร์ชันต่างๆ (เคอร์เนลของ Ubuntu เวอร์ชันอื่นๆ เช่น 18.04, 22.04, เคอร์เนลบิวด์แบบเมนไลน์) และดูว่ายังมีปัญหาอยู่หรือไม่ หากเซิร์ฟเวอร์ของคุณไม่ขัดข้องกับเวอร์ชันเคอร์เนลอื่น แสดงว่าคุณกำลังเผชิญกับข้อบกพร่องของเคอร์เนลที่ส่งผลกระทบต่อ 20.04
  2. ดูเหมือนว่าแม้ว่าเคอร์เนลจะรับรู้ถึงความล้มเหลว แต่ก็ไม่สามารถเขียนปัญหาไปยัง syslog ได้ ตรวจสอบว่าคุณเห็นเคอร์เนลแพนิคบนคอนโซลหรือไม่ แต่ถ้าหน้าจอปิดอยู่ คุณจะไม่สามารถเปิดอีกครั้งด้วยเคอร์เนลที่ขัดข้อง ดังนั้นคุณควรปิดการใช้งานหน้าจอที่ดับลงเนื่องจากไม่ได้ใช้งาน นอกจากนี้ คุณสามารถลองใช้ crashkernel (ทิ้ง) เพื่อรับข้อมูลเพิ่มเติมเกี่ยวกับข้อขัดข้อง; หรือคุณสามารถเปลี่ยนเส้นทางเอาต์พุตคอนโซลไปยังพอร์ตอนุกรมและบันทึกเอาต์พุตด้วยอุปกรณ์ภายนอก แต่ฉันไม่เคยลองเลย
  3. คุณยังสามารถทดสอบ Ubuntu รุ่นต่าง ๆ พร้อมกัน หรือบางทีอาจจะเป็นรุ่นต่าง ๆ ของ Linux ก็ได้ แต่โดยปกติแล้วนั่นไม่จำเป็น (การหยุดทำงานมักเกิดจากเคอร์เนลและไดรเวอร์ คุณยังสามารถลองใช้ระบบปฏิบัติการอื่น เช่น FreeBSD หรือ Windows เพื่อดูว่าคอมพิวเตอร์ค้างหรือไม่ หากการค้างเกิดขึ้นกับ OS อื่นด้วย แสดงว่าคุณมีปัญหาเกี่ยวกับฮาร์ดแวร์อย่างแน่นอน
  4. วิ่ง ทดสอบความจำ เพื่อตรวจหาโมดูล RAM ที่ผิดพลาดที่อาจเกิดขึ้นได้ Memtest ต้องการการควบคุมคอมพิวเตอร์อย่างสมบูรณ์ (คุณต้องบูตเครื่องแทนระบบปฏิบัติการของคุณ) ดังนั้นเซิร์ฟเวอร์ของคุณจึงไม่สามารถทำงานได้ในขณะที่การทดสอบกำลังทำงานอยู่
  5. น่าเสียดายที่ความล้มเหลวของฮาร์ดแวร์อาจเป็นเรื่องร้ายกาจเมื่อไม่ชัดเจนว่าปัญหาคืออะไร ฉันไม่รู้ว่าคุณเปลี่ยนอะไร แต่คุณสามารถมีเมนบอร์ด CPU หรือ PSU ที่เสียได้ เมื่อคอมพิวเตอร์ของฉันปิดสวิตช์แบบสุ่ม ในตอนแรกฉันไม่รู้ว่าอะไรคือสาเหตุ แต่กลับกลายเป็นว่าสายไฟของฉันมีปัญหาในการสัมผัส การเปลี่ยนใหม่ทำให้ปัญหายุติลง
k304 avatar
br flag
ขอบคุณสำหรับการตอบกลับของคุณ. ฉันได้เปลี่ยนฮาร์ดแวร์ทั้งหมดแล้ว (อันที่จริงเป็นเซิร์ฟเวอร์โฮสต์ของบริษัทฝรั่งเศสบางแห่ง ดังนั้นพวกเขาจึงบอกฉันว่าได้เปลี่ยนฮาร์ดแวร์ทั้งหมดใหม่ทั้งหมดแล้ว) รวมถึง CPU, Mainboard และอื่น ๆ ดังนั้นอาจไม่ใช่ปัญหาฮาร์ดแวร์ tho พวกเขาพบ RAM และ Mainboard ที่ผิดพลาดในเซิร์ฟเวอร์เก่า ฉันได้ลองใช้เคอร์เนลเวอร์ชันต่างๆ แล้ว และแม้กระทั่งอัปเดตเคอร์เนลเมื่อเร็ว ๆ นี้เนื่องจากมีเวอร์ชันใหม่กว่า ฉันจะดู `kdump` และดูว่ามันจะรายงานอะไรกับฉันบ้าง

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา