Score:0

Ubuntu 21.04-21.10 การปิดระบบแบบสุ่ม ไม่มีบันทึก

ธง tj

ฮาร์ดแวร์ (ฮาร์ดอินโฟ):

ฉันหวังว่านี่จะไม่ใช่ปัญหาฮาร์ดแวร์...

    ระบบปฏิบัติการ: อูบุนตู 21.10
    CPU: Intel(R) Core(TM) i7-8550U CPU @ 1.80GHz, 1 โปรเซสเซอร์จริง; 4 คอร์; 8 เธรด
    RAM: 7858608 KiB (8GB)
    เมนบอร์ด: Lenovo YOGA 730-13IKB / LNVNB161216 (LENOVO)
    กราฟิก: 1920x1080 (ไม่ทราบ) รากฐาน X.Org
    ที่เก็บข้อมูล: (ไม่แสดงอะไรด้วยเหตุผลบางประการ แต่ฉันได้เปิดคอมพิวเตอร์เพื่อทำความสะอาดเพื่อแก้ไขปัญหานี้แล้ว และฉันยืนยันว่าเป็น NVMe SSD
    เครื่องพิมพ์: (ไม่เกี่ยวข้อง)
    เสียง: USB-Audio - อุปกรณ์ USB 0x46d

อาการ:

สิ่งที่ฉันเกลียด

ตอนนี้ตั้งแต่อัปเกรดจาก Ubuntu 20.04 LTS เป็น Ubuntu 21.04 ฉันพบข้อขัดข้องบางประการ ข้อขัดข้องเหล่านี้:

  • อย่ารีบูตโดยอัตโนมัติ
  • เกิดขึ้นเอง
  • เกิดขึ้นเฉพาะเมื่อเสียบปลั๊กไฟ AC
  • ไม่มีสัญญาณของการเข้าสู่ระบบทุกที่
  • รายการ

ความพยายาม:

สิ่งที่ไม่ได้ผล

ฉันพยายามติดตั้งระบบใหม่อย่างน้อยสองครั้ง (ฉันลืมไปแล้ว แต่มันเป็นสองครั้งขึ้นไป) อัปเดตจาก 21.04 เป็น 21.10 ในกระบวนการนอกจากนี้ น่าสังเกตว่าฉันเลือกโปรแกรมที่จะสำรองข้อมูล โดยเลือกเฉพาะโปรแกรมที่:

  • ไม่ได้ติดตั้งโดยอัตโนมัติ
  • ไม่ใช่ในเครื่อง (ฉันสามารถติดตั้ง debs เหล่านั้นใหม่ได้ในภายหลัง)
  • ทั้งหมด ไม่ใช่การพัฒนาห้องสมุดโดยอัตโนมัติ

ข้อแตกต่างที่โดดเด่นเพียงอย่างเดียวจาก 21.04 และ 21.10 ในข้อขัดข้องคือไม่มีเลย (IIRC)

สิ่งอื่น ๆ ที่ฉันได้ลอง:

  • อัพเดตไบออส
  • กำลังติดตั้งใหม่ ความร้อน
  • ปิดการใช้งาน c-สถานะ (และเปิดใช้งานอีกครั้งเนื่องจากไม่ได้ช่วย)
  • พยายามที่จะ ล็อกเคอร์เนล (ไม่สามารถตั้งค่าได้อย่างถูกต้อง ข้อผิดพลาดแบบแมนนวลทำให้ไม่มีการบันทึก)
  • ติดตั้ง วารสารถาวร (ไม่พบประโยชน์อะไรในนั้น ฉันสามารถโพสต์ได้หากจำเป็น)

พิเศษ

ข้อมูลเพิ่มเติมบางอย่างที่อาจช่วยได้

ข้อมูลชิ้นสุดท้ายที่ฉันสามารถให้ได้คือไฟล์ข้อความ ซึ่งฉันได้เขียนหลายสิ่งหลายอย่างที่ฉันพยายาม สงสัย และล้มเหลว มันไม่เป็นระเบียบมาก (โดยเฉพาะอย่างยิ่งในตอนท้ายเมื่อฉันเพิ่งหงุดหงิดและเริ่มสาปแช่งในตอนท้ายของไฟล์) แต่ฉันจะรวมไว้

บันทึกส่วนบุคคล:

เมื่อฉันอัปเดตเป็น Ubuntu 21.04 สิ่งเริ่มผิดพลาด
ฉันเดาว่า schedutil กำลังทำอะไรบางอย่างอยู่ เพราะบางครั้งคอมพิวเตอร์ก็ล่ม ไม่มีบันทึกหรืออะไรทั้งนั้น
ฉันตรวจสอบ /var/log/kern.log และไม่พบอะไรเลย

ฉันสงสัยว่ามันเกี่ยวข้องกับ "P-state" และ "C-state"
P-state ซึ่งหมายถึงสถานะประสิทธิภาพ ใช้เพื่อเพิ่มประสิทธิภาพการใช้พลังงานระหว่างการดำเนินการโค้ด ระบบปฏิบัติการสามารถเปลี่ยนแปลงได้เพื่อเปลี่ยนแรงดันไฟฟ้าของ CPU (ในระยะสั้น เปลี่ยนความถี่ของ CPU)
ในทางกลับกัน สถานะ C ใช้เพื่อเพิ่มประสิทธิภาพ/ลดการใช้พลังงานระหว่างโหมดไม่ได้ใช้งาน (เมื่อไม่มีการดำเนินการโค้ด)
C-state ทั่วไปคือ:
    C0 - CPU กำลังรันโค้ด (สถานะ P)
    C1 - CPU ใช้คำสั่ง HLT เมื่อไม่ได้ใช้งาน นาฬิกาจะถูกปิดไปยังส่วนต่างๆ ของแกนกลาง แต่จะตื่นขึ้นค่อนข้างเร็ว
    C1E - นี่เป็นเพียง C1 ยกเว้นเมื่อเปิดใช้งาน C1E CPU จะลดความเร็วและแรงดันไฟฟ้าของ CPU เมื่ออยู่ใน C1
    C2 & สูงกว่า - CPU จะปิดส่วนต่างๆ ของคอร์เพื่อการประหยัดพลังงานที่มากขึ้น โดยที่ไม่ต้องปลุกอีกต่อไป
ที่มา: "การควบคุมการใช้งาน C-State ของโปรเซสเซอร์ใน Linux เอกสารทางเทคนิคของ Dell ที่อธิบายถึงการใช้ C-state กับระบบปฏิบัติการ Linux"

อย่างไรก็ตาม ทั้งหมดนี้ยังคงเกิดขึ้นในขณะนี้ แม้แต่ใน 21.10 ดังนั้นนี่จะต้องเป็นปัญหาของเคอร์เนล
แม้ว่าการตั้งค่า "intel_idle.max_cstate=0" จะไม่หยุดการหยุดทำงาน ดังนั้นอาจเป็นปัญหาอื่น
ฉันใช้ "memtest86" แล้ว และระบบของฉันก็ปกติดี
ฉันจะรีสตาร์ทคอมพิวเตอร์และดูว่ามีการตั้งค่า c-state ใน BIOS/UEFI หรือไม่ (การตั้งค่ายังคงเรียกว่า BIOS หรือไม่)

ใช่ ฉันตรวจสอบแล้วไม่พบอะไรเลย

PDF สถานะ C ของ Dell (เหมือนกันในแหล่งที่มาด้านบน) มีส่วนนี้อยู่ด้านล่าง C-state หนึ่ง (ซึ่งเป็น www แรก) ที่เรียกว่า "การตรวจสอบการใช้งาน C-State" มันบอกว่า:
    มีหลายวิธีในการดูว่ามีเวลาว่างเท่าใดในสถานะ C ต่างๆ 
    ก่อนอื่นให้ตรวจสอบข้อความเคอร์เนลจากการบู๊ต (เช่น âdmesg |grep idleâ หรือ âgrep idle /var/log/messagesâ เป็นต้น) เพื่อดูว่าไดรเวอร์ใดที่ไม่ได้ใช้งานใช้งานอยู่

นี่คือสิ่งที่ฉันได้รับ:
    sudo dmesg |grep ไม่ได้ใช้งาน
    [sudo] รหัสผ่านสำหรับ ws: 
    [ 0.028186] clocksource: กลั่น-jiffies: หน้ากาก: 0xffffffff max_cycles: 0xffffffff, max_idle_ns: 7645519600211568 ns
    [ 0.076265] clocksource: hpet: มาสก์: 0xffffffff max_cycles: 0xffffffff, max_idle_ns: 79635855245 ns
    [ 0.100211] clocksource: tsc-early: มาสก์: 0xffffffffffffffff max_cycles: 0x39a8208cdd2, max_idle_ns: 881590748921 ns
    [ 0.104538] กระบวนการ: ใช้ mwait ในเธรดที่ไม่ได้ใช้งาน
    [ 0.128722] clocksource: jiffies: หน้ากาก: 0xffffffff max_cycles: 0xffffffff, max_idle_ns: 7645041785100000 ns
    [ 0.132319] cpuidle: ใช้บันได Governor
    [ 0.132322] cpuidle: ใช้เมนูผู้ว่าราชการ
    [ 0.389960] แหล่งสัญญาณนาฬิกา: acpi_pm: หน้ากาก: 0xffffff max_cycles: 0xffffff, max_idle_ns: 2085701024 ns
    [ 1.426615] clocksource: tsc: มาสก์: 0xffffffffffffffff max_cycles: 0x396d4ffc055, max_idle_ns: 881590662783 ns
    [ 4.981048] systemd-journald[323]: varlink-22: varlink: การตั้งค่าสถานะไม่ได้ใช้งานเซิร์ฟเวอร์
    [ 4.981116] systemd-journald[323]: varlink-22: varlink: การเปลี่ยนสถานะไม่ได้ใช้งานเซิร์ฟเวอร์ â วิธีการประมวลผล
    [5.336734] systemd-journald[323]: varlink-22: varlink: การเปลี่ยนสถานะวิธีการประมวลผล â เซิร์ฟเวอร์ที่ไม่ได้ใช้งาน
    [ 5.339242] systemd-journald[323]: varlink-22: varlink: การเปลี่ยนสถานะไม่ได้ใช้งานเซิร์ฟเวอร์ â รอการตัดการเชื่อมต่อ
ฉันไม่เห็นอะไรเลยที่นี่ แต่ฉันจำได้ในการตั้งค่า BIOS/UEFI มีบางอย่างที่บอกว่า ACPI แทนที่จะเป็น RXS หรืออะไรก็ตามที่มันเรียกว่า
ฉันไม่สามารถเปิดโฟลเดอร์ "/proc/acpi/processor/CPU0/power" ได้เนื่องจากไม่มีอยู่ (เข้าถึงได้เฉพาะ "acpi")

ในเวลาต่อมา ฉันตัดสินใจติดตั้ง Ubuntu ใหม่ และฉันก็ทำเช่นนั้น สิ่งต่าง ๆ ทำงานได้ดีในวันแรก (และวันที่สอง) จากนั้นมันก็หยุดทำงาน
หลังจากลองเล่นไปมา ฉันตัดสินใจเรียกใช้ "เซนเซอร์นาฬิกา" และฉันก็ค้นพบบางอย่าง เมื่อเล่น osu! อุณหภูมิของฉันพุ่งสูงถึง ~95ºC ถึง 99ºC!
แค่อยากจะบอกว่า killswitch ของพีซีทำงานที่อุณหภูมิ 100ºC ฉันอยู่ห่างจากมัน 1 องศา และส่วนใหญ่อยู่ห่างออกไป 2 องศา (ส่วนใหญ่ประมาณ 96-98ºC)!

อีกความคิดหนึ่ง นี่อาจเป็นปัญหาของ PSU เพราะฉันไม่เคยเห็นมันพังโดยไม่ได้เสียบปลั๊กเลย..

"kernelUpdateCrash" เป็นชื่อเก่าของไฟล์นี้ ตอนนี้เป็น "cleaningComputer" ฉันเปิดคอมพิวเตอร์ขึ้นมาและนรกสวรรค์มีแฟน ๆ มากมาย
ไม่พังตั้งแต่ทำความสะอาด! ไม่ขออธิบายรายละเอียดมากเพราะไฟล์นี้ยาวมากและฉันได้เปิดคอมพิวเตอร์อีกเครื่องซึ่งจะอยู่ในเรื่องราวอื่น (ฉันคิดว่าฉันจะเรียกมันว่า "การติดตั้ง firstUbuntu")


ปรับปรุงก็ล้มเหลวอีกครั้ง
มันไม่ได้อยู่ด้านข้าง ดังนั้นฉันคิดว่ามันเป็นปัญหาในการนำอากาศของพัดลม
คำถามเกี่ยวกับ askubuntu ทำให้คอมพิวเตอร์ปิดลงเนื่องจากเครื่องร้อน ฉันไม่แน่ใจว่าเครื่องร้อนในกรณีของฉันหรือไม่ แต่การอัปเดตไบออสช่วยได้
ที่มา: "https://askubuntu.com/questions/1232813/ubuntu-20-04-shutdown-after-overheating"

ทำแล้วครับ ต้องบูตเข้า Windows PE USB เพื่อรันโปรแกรม แต่โปรแกรมไม่ทำงาน...
ดังนั้น แทนที่จะติ๊กที่ตัวเลือก "ติดตั้ง" ฉันเลือกตัวเลือก "แกะกล่อง" และมันแกะไฟล์ปฏิบัติการอื่นที่มีชื่อเดียวกัน ยกเว้นตอนนี้ตัวอักษรทั้งหมดเป็นตัวพิมพ์ใหญ่!
ยังไงก็ตามฉันรันมันและมันเป็นการตั้งค่าแบบร่างแปลก ๆ ที่ดูเหมือนจะใช้ WinAPI เพื่อใส่ข้อความในที่ที่ไม่ควรอยู่และมันจะไม่ทำงานหากไม่มีไฟ AC
ฉันเสียบปลั๊กแล้วรันใหม่ มันมีรูปมาสคอตที่ดูเหมือนดินสอที่แตกและอาจแตกหัก?
ฉันแนบรูปภาพ 2 รูปที่ฉันถ่ายด้วยโทรศัพท์ นั่นเป็นสาเหตุที่เรื่องราวนี้อยู่ในโฟลเดอร์
พีซีรีบูตเครื่อง ใช้งานได้ จากนั้นพัดลมก็เริ่มส่งเสียงหวีดหวิวราวกับว่าของจะระเบิด ไม่เคยเห็นแบบนี้มาก่อน อาจเป็นเพราะกระแสไฟเกินชั่วคราวของพัดลมในขณะที่คอมพิวเตอร์พยายามรีบูต
ใช่ ฉันเปลี่ยนชื่อเรื่องนี้อีกครั้ง

มันแตกอีกแล้ว...

ครั้งสุดท้ายที่ฉันแก้ไขไฟล์นี้คือ: 2021å¹´10æ26æ¥ 19æ55å59ç§
ตอนนี้คือ: 2021å¹´11æ06æ¥ 23æ10å36ç§
ฉันเพิ่งติดตั้งระบบระบายความร้อนใหม่ ดูเหมือนว่าจะใช้งานได้ ฉันไม่แน่ใจ ฉันเดาว่าคันเร่งดี
สคริปต์ "setPerformanceMode.sh" และ "setPowersaveMode.sh" ที่ฉันสร้าง (โดยใช้ cpufreq) ดูเหมือนจะไม่เปลี่ยนแปลงอะไรอีกต่อไป
ดังนั้นหวังว่าจะใช้งานได้แม้ว่าจะติดตั้ง thermald เป็นค่าเริ่มต้น ...
PS: ฉันมี i7z บนเทอร์มินัลที่ตั้งค่าเป็น "อยู่ด้านบนเสมอ" ดังนั้นฉันจึงสามารถตรวจสอบความถี่ สถานะ C และอุณหภูมิของคอร์ CPU (4 ฟิสิคัล โลจิคัล)

Bruh Thermald กำลังลดความเร็วลงเหลือ 400MHz ขณะเล่น
ฉันแท็บออกจากโปรแกรม มันจะกลับไปเป็น 1GHz คืออะไร?
โอเค ฉันทำ Osu! ตั้งค่าขีดจำกัด FPS เป็น V-Sync (60fps) แทนที่จะเพิ่มเป็นสองเท่า (120fps ซึ่งเป็นเมื่อก่อน) และดูเหมือนว่าจะดีแม้ว่าคอมพิวเตอร์จะไม่ได้อยู่ด้านข้างก็ตาม (ปกติแล้วจะไม่ขัดข้องเมื่ออยู่ด้านข้าง ตามที่แฟน ๆ ชี้ให้เห็น

โอเค ฉันกำลังตรวจสอบบันทึกของ journalctl และได้รับ:
"thermald.service: เปลี่ยนการทำงาน -> stop-sigterm"
ฮะ...
โอ้ เดี๋ยวก่อน นี่คือตอนท้ายของวารสาร มันอาจจะปิดตัวลง ç¬

ตรวจสอบคำหลักด้วย "journalctl -g ???":
    ระบายความร้อน
    กำลังปิด
    ชน
    ตื่นตกใจ
    จุดประกาย
มันขัดข้องขณะค้นหาใน journalctl... มาตรวจสอบด้วย "journalctl -b -1" หึ บันทึกสุดท้ายคือ 4 นาทีก่อนเครื่องพัง โอเค...
ใช่ ฉันกำลังขอความช่วยเหลือใน AskUbuntu ควรทำตั้งนานแล้ว!
เอาล่ะตอนนี้ฉันต้องคัดลอกสิ่งนี้ลงในคำถาม

เชิงอรรถ

หากมีข้อมูลอื่นๆ ที่ฉันสามารถให้ได้ โปรดแสดงความคิดเห็น ฉันจะตรวจสอบให้

อย่างสม่ำเสมอและอัปเดตโพสต์ตามลำดับ อีกครั้ง นี่อาจเป็นปัญหาเกี่ยวกับฮาร์ดแวร์ แต่เกิดขึ้นเมื่อฉันอัปเดตระบบ และในขณะนี้เนื่องจาก Wayland และสิ่งอื่นๆ อีกหลายอย่าง ฉันไม่สามารถดาวน์เกรดเป็น 20.04 LTS และดำเนินการกับมันได้

Doug Smythies avatar
gn flag
ดูว่า[ที่นี่](https://askubuntu.com/questions/1373633/how-to-troubleshoot-cpu-hw-crash-in-ubuntu-18-04)และ/หรือ[ที่นี่](https://askubuntu .com/questions/1370731/cpu-package-badly-configured-on-my-msi-laptop-how-to-reconfigure) ช่วยได้
CattoByte avatar
tj flag
@DougSmythies ขอโทษที่ไม่ได้ติดต่อกลับ ช่วงนี้เป็นช่วงสอบ... อย่างไรก็ตาม ฉันจะลองทำสิ่งเหล่านั้น จากนั้นจึงทำงานที่ต้องใช้ทรัพยากรจำนวนมาก (ซึ่งมักจะปิดการทำงาน) หากได้ผล คุณสามารถโพสต์คำตอบพร้อมกับสิ่งเหล่านั้น และฉันจะทำเครื่องหมายว่าคำตอบนั้นถูกต้อง

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา