ฉันมีปัญหาดังต่อไปนี้:
เมื่อใดก็ตามที่เซิร์ฟเวอร์ของฉันถูกเปิดเผยต่ออินเทอร์เน็ต จะไม่สามารถเข้าถึงได้หลังจากช่วงระยะเวลาหนึ่ง ช่วงเวลาแตกต่างกันไป เมื่อใดก็ตามที่สิ่งนี้เกิดขึ้น ฉันสามารถ ping เซิร์ฟเวอร์จากเครือข่ายท้องถิ่นของฉันได้ แต่ฉันไม่สามารถเข้าถึงเซิร์ฟเวอร์ผ่านที่อยู่ dyndns ในเบราว์เซอร์ของฉัน ที่อยู่ IP ของมัน และฉันก็ยังไม่สามารถ ssh เข้าไปได้ วิธีเดียวที่ฉันพบว่าแก้ไขได้คือรีสตาร์ทเครื่อง
ปัญหามักจะเริ่มเกิดขึ้นหลังจากผ่านไปประมาณหนึ่งวันและมักจะเกิดขึ้นในช่วงกลางคืน ฉันได้ดูบันทึกและได้ข้อสรุปดังต่อไปนี้:
ตัวจัดการเครือข่าย (NetworkManager.service) หยุดทำงานและไม่รีสตาร์ทจนกว่าจะรีบูต:
22 ม.ค. 02:25:52 น. mussingerwebserver dockerd[2161]: time="2022-01-22T02:25:07.391683481+01:00" level=warning msg="การตรวจสุขภาพสำหรับคอนเทนเนอร์
22 มกราคม 02:26:32 เคอร์เนล mussingerwebserver: [UFW BLOCK] IN=enp1s0 OUT= MAC=01:00:5e:00:00:fb:b0:35:b5:df:07:d2:08:00 SRC= 192.168.178.66 DST=224.0.0.251 LEN=32 TOS=0x00 PREC=0x00 TTL=1 ID=17286 PROTO=2
22 มกราคม 02:25:33 น. mussingerwebserver CRON[16536]: (www-data) CMD (php7.2 -f /var/www/nextcloud/cron.php)
22 ม.ค. 02:25:47 น. mussingerwebserver NetworkManager[1229]: <info> [1642814746.7425] manager: ขณะนี้สถานะ NetworkManager คือ CONNECTED_GLOBAL
22 มกราคม 02:26:45 น. mussingerwebserver whoopsie[1951]: [02:25:52] ไม่สามารถรับรายการการเชื่อมต่อที่ใช้งานอยู่: หมดเวลาแล้ว
22 ม.ค. 02:26:45 น. mussingerwebserver whoopsie [1951]: [02:26:02] ไม่สามารถเข้าถึง: https://daisy.ubuntu.com
22 ม.ค. 02:27:06 น. mussingerwebserver dockerd[2161]: time="2022-01-22T02:25:17.538581342+01:00" level=warning msg="การตรวจสุขภาพสำหรับคอนเทนเนอร์
22 ม.ค. 02:27:06 น. mussingerwebserver dockerd[2161]: time="2022-01-22T02:25:17.538881010+01:00" level=warning msg="ตรวจสุขภาพคอนเทนเนอร์
22 ม.ค. 02:27:06 น. mussingerwebserver dockerd[2161]: time="2022-01-22T02:25:17.672603919+01:00" level=warning msg="การตรวจสุขภาพสำหรับคอนเทนเนอร์
22 ม.ค. 02:27:06 น. mussingerwebserver dockerd[2161]: time="2022-01-22T02:25:17.538587478+01:00" level=warning msg="การตรวจสอบสุขภาพสำหรับคอนเทนเนอร์ fb75e0eeb20a372aeb64ea6604139232a5154ca2273ee214a4ef81ed
เอสโคด
สิ่งนี้แสดงให้เห็นอย่างชัดเจนว่าตัวจัดการเครือข่ายล้มเหลวในเวลาเดียวกัน (เซิร์ฟเวอร์ทำงานตลอดเวลา แต่ตัวจัดการเครือข่ายไม่ได้เขียนอะไรลงในบันทึก):
22 ม.ค. 00:46:08 น. mussingerwebserver NetworkManager[1229]: <info> [1642808768.036
22 ม.ค. 00:50:39 น. mussingerwebserver NetworkManager[1229]: <info> [1642809039.276
22 มกราคม 01:56:08 น. mussingerwebserver NetworkManager[1229]: <info> [1642812968.055
22 มกราคม 01:56:08 น. mussingerwebserver NetworkManager[1229]: <info> [1642812968.055
22 ม.ค. 02:00:39 น. mussingerwebserver NetworkManager[1229]: <info> [1642813239.265
22 ม.ค. 02:21:08 น. mussingerwebserver NetworkManager[1229]: <info> [1642814468.045
22 ม.ค. 02:21:08 น. mussingerwebserver NetworkManager[1229]: <info> [1642814468.045
22 ม.ค. 02:25:47 น. mussingerwebserver NetworkManager[1229]: <info> [1642814746.742
-- รีบูต --
22 ม.ค. 09:37:42 mussingerwebserver systemd[1]: กำลังเริ่มต้น Network Manager...
เมื่อเร็ว ๆ นี้ฉันบล็อกไม่ให้เชื่อมต่ออินเทอร์เน็ตได้ระยะหนึ่ง (สองสามสัปดาห์) และมันไม่ได้ทำงานแบบนั้นเลยแม้แต่ครั้งเดียว ไม่กี่วันที่ผ่านมาฉันเปิดมันอีกครั้งและปัญหาก็เริ่มเกิดขึ้นอีก
ระบบ:
เดสก์ท็อปพีซีเครื่องเก่าที่ใช้ Ubuntu 18.04.6 LTS
ติดตั้ง Nextcloud, Unifi Network manager, Influxdb และ netdata แล้ว
Nextcloud สัมผัสกับอินเทอร์เน็ตผ่าน Duckdns (บน Fritzbox) ด้วยใบรับรอง SSL ที่เข้ารหัส
เครื่องเชื่อมต่อผ่านอีเธอร์เน็ต
ฉันเหนื่อย:
เพื่อค้นหาการเข้าสู่ระบบ apport /var/crashไดเร็กทอรีนี้ไม่มีรายงานข้อขัดข้องจากเหตุการณ์นี้ แต่ฉันสามารถทำให้ apport สร้างรายงานข้อขัดข้องได้โดยการเข้าไปยุ่งและออกคำสั่งที่ไม่รองรับ ตอนแรกฉันคิดว่ามันอาจไม่มีสิทธิ์ที่จำเป็นในการเขียนถึง /var/crash แต่ดูเหมือนจะไม่เป็นเช่นนั้น
ฉันได้ตรวจสอบด้วยว่าเปิดใช้งานการรีสตาร์ทเมื่อล้มเหลวหรือไม่ และดูเหมือนว่าจะเป็น
/lib/systemd/system/NetworkManager.service สถานะ:
รีสตาร์ท = เมื่อล้มเหลว
ณ จุดนี้ ฉันไม่รู้ว่าจะค้นหาอะไรอีกต่อไป และหวังว่าจะมีคนช่วยตอบคำถามต่อไปนี้:
- เหตุใด NetworkManager จึงขัดข้อง
- นั่นคือต้นตอของปัญหาของฉันหรือเป็นเพียงอาการ?
- เหตุใด apport จึงล้มเหลวในการสร้างบันทึกข้อผิดพลาด เกิดข้อผิดพลาดขึ้นอย่างชัดเจน เหตุใดจึงเรียก Whoopsie ได้อีก
- เหตุใด NetworkManager จึงไม่รีสตาร์ทแม้ว่าการกำหนดค่าจะระบุว่าควร
ฉันหวังว่าจะมีคนช่วยฉันได้