Score:0

ดูเหมือนว่า Remote Server จะตาย จะแก้ปัญหาอย่างไร?

ธง us

ฉันมีเซิร์ฟเวอร์ Ubuntu ที่ทำงานจากระยะไกลในสำนักงานอื่น มันตายไปสองสามครั้งและฉันไม่สามารถหาสาเหตุได้ เป็นเซิร์ฟเวอร์ที่ร้องขอบริการภายนอกผ่าน API โดย ตาย ฉันหมายความว่ามันยังคงทำงานอยู่ แต่เพิ่งหยุดทำงาน ดูเหมือนว่าเครือข่ายของเซิร์ฟเวอร์จะออฟไลน์ด้วยและการสแกน LAN ไม่พบ

อยู่เบื้องหลังเราเตอร์สำนักงานและเรียกใช้เคอร์เนล 18.04 4.15.0-147-generic ไม่มีใครในไซต์มีบัญชีบนเซิร์ฟเวอร์นี้

นี่คือสิ่งที่ฉันได้ลอง

  1. รีบูตครั้งล่าสุด ผลลัพธ์:
รีบูตระบบ บูต 4.15.0-151-gener พฤ. ก.ค. 22 14:49 ยังคงทำงานอยู่
รีบูตระบบ บูต 4.15.0-147-gener วันพุธที่ 21 กรกฎาคม 15:48 ยังคงทำงานอยู่
รีบูตระบบ บูต 4.15.0-147-gener พุธ 21 ก.ค. 14:05 - 15:48 (01:43 น.)
รีบูตระบบ บูต 4.15.0-147-gener ส. 17 ก.ค. 18:24 - 15:48 (3+21:24)
รีบูตระบบ บูต 4.15.0-147-gener พฤ ก.ค. 58 17:26 - 15:48 (5+22:22)

22 ก.ค. 14:49 น เป็นการรีบูตที่ฉันขอให้พนักงานในสถานที่ทำ ไฟฟ้าดับเมื่อวันที่ 21 ก.ค.

  1. /var/log/syslog
22 ก.ค. 09:08:50 localhost service_start.sh[946]: INFO:launcher:myjob จบการส่งออกสำหรับ 2
22 ก.ค. 09:08:50 localhost service_start.sh[946]: INFO:launcJul 22 14:50:05 localhost systemd[1]: การเริ่มต้น Flush Journal ไปยังที่เก็บข้อมูลถาวร ...
22 ก.ค. 14:50:05 localhost systemd [1]: เริ่มต้นภูตข้อมูลเมตา LVM2
22 กรกฎาคม 14:50:05 localhost systemd [1]: เริ่มโหลด / บันทึก Random Seed
22 ก.ค. 14:50:05 localhost lvm[443]: 2 โลจิคัลวอลุ่มในกลุ่มวอลุ่ม "localhost-vg" ถูกมอนิเตอร์
22 ก.ค. 14:50:05 localhost systemd[1]: เริ่มแล้ว ตั้งค่าเค้าโครงแป้นพิมพ์คอนโซล
22 ก.ค. 14:50:05 localhost systemd-modules-load[436]: โมดูลที่แทรก 'iscsi_tcp'

ระบบออฟไลน์หลังจากนั้น 22 ก.ค. 09:08:50 น. 22 ก.ค. 14:50:05 น เป็นการรีบูตที่กล่าวถึงก่อนหน้านี้

ดูเหมือนว่าระบบไม่ได้รีบูตหรือปิดระบบ มิฉะนั้นควรมีบันทึกบางอย่างระบุไว้ และไม่มีบันทึกข้อผิดพลาดของระบบใน syslog เช่นกัน

มีการตั้งค่างาน cron ของผู้ใช้สองรายการให้ทำงานทุก ๆ 5 และ 10 นาทีและมีรายการเรียกใช้ cron ใน syslog 22 ก.ค. 09:05:01น ก่อนที่ระบบจะล่ม 22 ก.ค. 09:08:50 น.

ไม่มีบุคลากรด้านเทคนิคในสถานที่ทำงาน และฉันสามารถเข้าถึงเซิร์ฟเวอร์ผ่าน teamview จากคอมพิวเตอร์ในสถานที่อื่นได้ในขณะนี้

ฉันเรียกใช้ htop และโหลดของระบบเบา

ตอนนี้ฉันกำลังสูญเสีย ฉันควรตรวจสอบอะไรอีกบ้างระหว่างเซสชันการดูแบบทีมครั้งต่อไป

Score:0
ธง br

คุณมีตัวแปรค่อนข้างน้อยในการอธิบายปัญหาของคุณ โดยหลักๆ แล้วคือโครงสร้างพื้นฐานของเครือข่ายในตำแหน่งที่โฮสต์เซิร์ฟเวอร์ หากนี่คือเซิร์ฟเวอร์ของฉัน ขั้นตอนแรกคือ ssh เข้าไปและทำดังนี้

หาง -f /var/log/syslog

การดำเนินการนี้หรือการตรวจสอบไฟล์บันทึกอื่นๆ อาจทำให้เข้าใจถึงสาเหตุที่ทำให้เซิร์ฟเวอร์ไม่ตอบสนอง

เนื่องจากคุณบอกว่าเซิร์ฟเวอร์ยังคงทำงานอยู่แม้ว่าเซิร์ฟเวอร์จะตาย (ไม่ชัดเจนว่าหมายความว่าอย่างไร) แบบนี้แสดงว่าขาดการเชื่อมต่อเครือข่าย ดังนั้นฉันจึงเน้นไปที่การตรวจสอบ

คุณอาจพบว่าวิธีที่เร็วที่สุดในการแก้ไขปัญหานี้คือการแก้ไขปัญหานี้ที่ไซต์งานผ่าน LAN ภายในเครื่อง

us flag
รู้สึกเหมือนตายเพราะดูเหมือนว่าจะออฟไลน์ในขณะที่กำลังดูทีม ฉันไม่สามารถ ping หรือ ssh ได้ มันกลับมาออนไลน์หลังจากรีบูต ฉันจะตั้งค่า sar เพื่อตรวจสอบระบบ นั่นเป็นสิ่งหนึ่งที่ฉันจะลอง ฉันหวังว่าฉันจะสามารถเชื่อมต่อจอภาพกับเซิร์ฟเวอร์ได้..
jones0610 avatar
br flag
คำตอบของฉันคือทำอย่างนั้น: ssh เข้าสู่เซิร์ฟเวอร์จากตำแหน่งใดก็ได้ในขณะที่เซิร์ฟเวอร์ยังคงทำงานอย่างถูกต้อง ดูว่า syslog จับสิ่งที่บ่งชี้ว่ามีปัญหาหรือไม่ จากคำอธิบายเบื้องต้นของคุณ ฉันคิดว่ามีบางอย่างเกิดขึ้นที่ทำให้ขาดการเชื่อมต่อเครือข่าย.... อาจเป็นเพราะปัญหาเซิร์ฟเวอร์หรือสิ่งที่เกิดขึ้นที่ไซต์โฮสต์ หากคำตอบของฉันช่วยคุณแก้ไขปัญหานี้ ฉันขอขอบคุณสำหรับการโหวต
us flag
ขอโทษที่ไม่ได้ทำงานเป็นเวลาหนึ่งสัปดาห์ ฉันได้สำรอง syslog แล้ว ตามบันทึกที่บันทึกไว้ก่อนและหลังเกิดปัญหา ดูเหมือนเป็นช่องว่าง ไม่มีอะไรเกิดขึ้นในระหว่างนั้น ดังที่ได้กล่าวไว้ก่อนหน้านี้ ฉันจะใช้ระบบตรวจสอบเพื่อช่วยในการแก้ไขปัญหานี้

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา