Score:1

ไดรเวอร์ NVIDIA หยุดทำงานทันทีหลังจากรีบูตจาก Windows การติดตั้งใหม่ล้มเหลว (Ubuntu 20.04)

ธง it

ข้อมูลระบบ

  • แล็ปท็อป MSI Creator 15
  • NVIDIA GeForce RTX 2070 SUPER มือถือ / Max-Q
  • จอมอนิเตอร์ LG Ultrawide ภายนอก
  • Windows 10 / Ubuntu 20.04 ดูอัลบูต

ปัญหา

ฉันใช้ไดรเวอร์ nvidia 455 บนเครื่อง Ubuntu 20.04 ของฉันสำเร็จเป็นเวลาประมาณหกเดือนแล้ว ฉันไม่ค่อยได้ใช้พาร์ติชัน Windows แต่ฉันใช้มันเมื่อวานนี้ หลังจากปิด Windows 10 และกลับไปใช้ Ubuntu จอภาพภายนอกของฉันก็หยุดทำงานโดยสิ้นเชิง

(หมายเหตุ: เป็นไปได้ว่า Windows ไม่มีส่วนเกี่ยวข้องกับปัญหา -- การรีสตาร์ทอาจทำให้ Ubuntu มีโอกาสอัปเดตแพ็คเกจและทำลายตัวเอง)

เห็นได้ชัดว่าไดรเวอร์ NVIDIA ไม่ทำงานอีกต่อไป วิ่ง nvidia-smi และคำสั่งอื่น ๆ ทำให้เกิดข้อผิดพลาดต่อไปนี้:

NVIDIA-SMI ล้มเหลวเนื่องจากไม่สามารถสื่อสารกับไดรเวอร์ NVIDIA ตรวจสอบให้แน่ใจว่าได้ติดตั้งและเรียกใช้ไดรเวอร์ NVIDIA ล่าสุดแล้ว

Google หาคำตอบ วิธีแก้ปัญหาส่วนใหญ่แนะนำให้ติดตั้งไดรเวอร์ NVIDIA ใหม่เมื่อสิ่งนี้เกิดขึ้น โปรดทราบว่าฉันต้องการไดรเวอร์กราฟิกและชุดเครื่องมือ CUDA พร้อมกับ เอ็นวีซีซี ฯลฯ..

ล้าง Nvidia

ฉันได้ลองใช้วิธีแก้ปัญหาต่างๆ มากมาย และเรียกใช้คำสั่งเหล่านี้ทุกครั้งที่ติดขัดและจำเป็นต้องเริ่มต้นใหม่

sudo apt ล้าง nvidia*
sudo apt ล้าง libnvidia*
sudo apt ลบอัตโนมัติ

โดยปกติฉันจะเรียกใช้สิ่งเหล่านี้ในโหมดการกู้คืนหลังจากไดรเวอร์ที่ติดตั้งใหม่ทำให้ Ubuntu ติดขัดในกระบวนการเริ่มต้นหลังจากรีบูต

ฉันยังตรวจสอบ dpkg -l | grep nvidia และลบแพ็คเกจใด ๆ ที่เหลือจากกระบวนการติดตั้ง สิ่งนี้จำเป็นเมื่อฉันต้องการติดตั้งไดรเวอร์เวอร์ชันเก่า

พยายามแก้ปัญหา

นี่คือรายการของทุกสิ่งที่ฉันได้ลอง:

  • รีสตาร์ทเครื่องนับครั้งไม่ถ้วน (รวมถึงการปิดเครื่องและถอดปลั๊กชั่วขณะ)

  • ต่อจากเจ้าพนักงาน คู่มือการติดตั้ง NVIDIA Cuda เพื่อติดตั้งไดรเวอร์ใหม่และจัดการข้อขัดแย้ง ตัวอย่างเช่น,

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/11.4.1/local_installers/cuda-repo-ubuntu2004-11-4-local_11.4.1-470.57.02-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu2004-11-4-local_11.4.1-470.57.02-1_amd64.deb
sudo apt-key เพิ่ม /var/cuda-repo-ubuntu2004-11-4-local/7fa2af80.pub
sudo apt-get อัปเดต
sudo apt-get -y ติดตั้ง cuda
  • พยายามขึ้นบัญชีดำ noveau และ nvidiafb:
บัญชีดำ nvidiafb
แบล็คลิสนูโว
ตัวเลือก nouveau modeset=0
  • เมื่อติดตั้งไดรเวอร์ nvidia ใหม่ ฉันลองใช้ไดรเวอร์หลายเวอร์ชัน (470, 465, 460, 455) โดยใช้วิธีการติดตั้งหลายวิธี (ขั้นแรกคือ deb จากนั้นเผยแพร่ผ่าน ubuntu จากนั้นจึงรันไฟล์) พวกเขาทั้งหมดล้มเหลวด้วยวิธีต่างๆ โดยทั่วไป เมื่อฉันรีบูตหลังจากติดตั้งไดรเวอร์ Ubuntu จะหยุดทำงานไม่สิ้นสุดเมื่อเริ่มต้น (ฉันเห็นหน้าจอสีดำพร้อมโลโก้ MSI และโลโก้ "ubuntu" บางครั้งมีวงกลมหมุน)

  • ไดรเวอร์ NVIDIA ดูเหมือนจะยังทำงานได้ดีใน Windows ดังนั้นฉันไม่คิดว่าการ์ดกราฟิกของฉันจะรวนหรืออะไรทำนองนั้น

  • บูตเข้าสู่โหมดการกู้คืน Ubuntu จาก grub และเลือกตัวเลือก dpkg repaiingr - ดูเหมือนจะไม่ช่วยอะไรเลย

  • sudo ubundu-drivers ติดตั้งอัตโนมัติ -- สิ่งนี้ติดตั้งไดรเวอร์ nvidia 470 ไม่สำเร็จ

  • ฉันสังเกตว่า ชื่อ -r ระบุว่าเวอร์ชันเคอร์เนลของฉันคือ 5.11 เมื่อตารางการสนับสนุนสำหรับไดรเวอร์ Nvidia แสดงว่ารองรับเฉพาะ 5.4 สำหรับ Ubuntu 20.04 ดังนั้นฉันจึงดาวน์เกรด o 5.4 และติดตั้งไดรเวอร์ nvidia ใหม่อีกครั้งโดยไม่ประสบความสำเร็จ

ข้อสังเกต

nvidia-smi สร้างเอาต์พุต (แทนที่จะเป็นข้อผิดพลาด) ในสถานการณ์ต่อไปนี้:

  • หลังจากติดตั้งไดรเวอร์ใหม่ แต่ก่อนรีสตาร์ทระบบ
  • ในโหมดการกู้คืนหลังจากติดตั้งไดรเวอร์ใหม่

อะไรตอนนี้?

ฉันกำลังสูญเสียสิ่งที่ต้องทำ สิ่งเดียวที่ฉันคิดได้คือติดตั้ง Ubuntu ใหม่ทั้งหมด ซึ่งดูเหมือนจะบ้าเมื่อทุกอย่างทำงานได้ดีเมื่อวานนี้

อ้างอิง

AskUbuntu.SE "หน้าจอว่างเปล่าหลังจากติดตั้งไดรเวอร์ที่จำกัดของ nvidia"

AskUbuntu.SE อูบุนตู 18.04 และ nVidia ติดอยู่หลังจากการบูต

AskUbuntu.SE การบูตค้างหลังจากติดตั้งไดรเวอร์ล่าสุดจาก PPA และแป้นพิมพ์ลัด Ctrl+Alt+F1 ไม่ทำงาน

AskUbuntu.SE ติดอยู่ที่หน้าจอบูต ปัญหาเกี่ยวกับไดรเวอร์กราฟิก Nvidia

ถามUbuntu.SE การเปลี่ยนไดรเวอร์ NVIDIA ทำให้ Ubuntu ค้างเมื่อเริ่มต้น

ถามUbuntu.SE หน้าจอว่างเปล่าหลังจากติดตั้งไดรเวอร์ที่จำกัดของ nvidia

ถามUbuntu.SE ไดรเวอร์กราฟิกหยุดทำงาน

ถามUbuntu.SE Ubuntu 20.04 กราฟิก Nvidia ใช้ไม่ได้ (แนะนำให้เปลี่ยนไปใช้เคอร์เนล 5.4)

ข้อมูลระบบ

ก่อนที่จะเขียนคำถามนี้ ฉันได้ล้างข้อมูลทุกอย่างออกจากระบบอีกครั้งโดยใช้วิธีการที่อธิบายไว้ข้างต้น ในสถานะนี้ นี่คือข้อมูลระบบบางส่วน:

เวอร์ชันเคอร์เนล

$ uname -r
5.4.0-80-ทั่วไป

การบูตที่ปลอดภัย

$ sudo mokutil --sb-รัฐ
ปิดใช้งาน SecureBoot

lshw

$ sudo lshw -C แสดง
  *-แสดงไม่มีการอ้างสิทธิ์       
       รายละเอียด: คอนโทรลเลอร์ที่รองรับ VGA
       สินค้า: TU104M [GeForce RTX 2070 SUPER Mobile / Max-Q]
       ผู้จำหน่าย: NVIDIA Corporation
       รหัสทางกายภาพ: 0
       ข้อมูลรถบัส: pci@0000:01:00.0
       รุ่น: a1
       ความกว้าง: 64 บิต
       นาฬิกา: 33MHz
       ความสามารถ: pm msi pciexpress vga_controller cap_list
       การกำหนดค่า: เวลาแฝง = 0
       ทรัพยากร: หน่วยความจำ:ac000000-acffffff หน่วยความจำ:80000000-8ffffffff หน่วยความจำ:90000000-91ffffff ioport:3000(size=128) หน่วยความจำ:ad000000-ad07ffff
  *-แสดง
       รายละเอียด: คอนโทรลเลอร์ที่รองรับ VGA
       ผลิตภัณฑ์: กราฟิก UHD
       ผู้จำหน่าย: Intel Corporation
       รหัสประจำตัว: 2
       ข้อมูลรถบัส: pci@0000:00:02.0
       รุ่น: 05
       ความกว้าง: 64 บิต
       นาฬิกา: 33MHz
       ความสามารถ: pciexpress msi pm vga_controller bus_master cap_list rom
       การกำหนดค่า: ไดรเวอร์ = เวลาแฝง i915 = 0
       ทรัพยากร: irq:191 หน่วยความจำ:ab000000-abffffff หน่วยความจำ:40000000-4ffffffff ioport:4000(size=64) หน่วยความจำ:c0000-dffff

ฮวินอินโฟ

$ hwinfo --gfxcard
16: PCI 100.0: 0300 คอนโทรลเลอร์ที่รองรับ VGA (VGA)             
  [สร้างที่ pci.386]
  รหัสเฉพาะ: VCu0.pBgP2fGEzV8
  รหัสผู้ปกครอง: vSkL.sXdMPV6yXb4
  รหัส SysFS: /devices/pci0000:00/0000:00:01.0/0000:01:00.0
  SysFS BusID: 0000:01:00.0
  คลาสฮาร์ดแวร์: กราฟิกการ์ด
  รุ่น: "คอนโทรลเลอร์ที่รองรับ nVidia VGA"
  ผู้ขาย: pci 0x10de "nVidia Corporation"
  อุปกรณ์: PCI 0x1e91 
  ผู้จำหน่ายย่อย: pci 0x1462 "Micro-Star International Co., Ltd. [MSI]"
  อุปกรณ์ย่อย: pci 0x12c6 
  การแก้ไข: 0xa1
  ช่วงหน่วยความจำ: 0xac000000-0xacffffff (rw,ไม่สามารถดึงล่วงหน้าได้,ปิดใช้งาน)
  ช่วงหน่วยความจำ: 0x80000000-0x8fffffff (ro, ไม่สามารถเรียกล่วงหน้าได้, ปิดใช้งาน)
  ช่วงหน่วยความจำ: 0x90000000-0x91ffffff (ro, ไม่สามารถเรียกล่วงหน้าได้, ปิดใช้งาน)
  พอร์ต I/O: 0x3000-0x307f (rw,ปิดใช้งาน)
  ช่วงหน่วยความจำ: 0xad000000-0xad07ffff (ro, ไม่สามารถดึงล่วงหน้าได้, ปิดใช้งาน)
  IRQ: 255 (ไม่มีกิจกรรม)
  โมดูลนามแฝง: "pci:v000010DEd00001E91sv00001462sd000012C6bc03sc00i00"
  ข้อมูลไดรเวอร์ #0:
    สถานะไดรเวอร์: nvidiafb ไม่ทำงาน
    Cmd การเปิดใช้งานไดรเวอร์: "modprobe nvidiafb"
  ข้อมูลไดรเวอร์ #1:
    สถานะคนขับ: นูโวไม่ได้ใช้งาน
    Cmd การเปิดใช้งานไดรเวอร์: "modprobe nouveau"
  ข้อมูลไดรเวอร์ #2:
    สถานะไดรเวอร์: nvidia_drm ไม่ทำงาน
    Cmd การเปิดใช้งานไดรเวอร์: "modprobe nvidia_drm"
  ข้อมูลไดรเวอร์ #3:
    สถานะไดรเวอร์: nvidia ไม่ทำงาน
    Cmd การเปิดใช้งานไดรเวอร์: "modprobe nvidia"
  สถานะการกำหนดค่า: cfg=new, avail=yes, need=no, active=unknown
  แนบกับ: #11 (สะพาน PCI)
 
34: PCI 02.0: 0300 คอนโทรลเลอร์ที่รองรับ VGA (VGA)
  [สร้างที่ pci.386]
  รหัสเฉพาะ: _Znp.7YEiQ6GHkFE
  รหัส SysFS: /devices/pci0000:00/0000:00:02.0
  SysFS BusID: 0000:00:02.0
  คลาสฮาร์ดแวร์: กราฟิกการ์ด
  ชื่ออุปกรณ์: "ออนบอร์ด - วิดีโอ"
  รุ่น: "คอนโทรลเลอร์ที่รองรับ Intel VGA"
  ผู้ขาย: pci 0x8086 "Intel Corporation"
  อุปกรณ์: PCI 0x9bc4 
  ผู้จำหน่ายย่อย: pci 0x1462 "Micro-Star International Co., Ltd. [MSI]"
  อุปกรณ์ย่อย: pci 0x12c6 
  การแก้ไข: 0x05
  ไดรเวอร์: "i915"
  โมดูลไดรเวอร์: "i915"
  ช่วงหน่วยความจำ: 0xab000000-0xabffffff (rw, ไม่สามารถดึงล่วงหน้าได้)
  ช่วงหน่วยความจำ: 0x40000000-0x4fffffff (ro, ไม่สามารถดึงล่วงหน้าได้)
  พอร์ต I/O: 0x4000-0x403f (rw)
  ช่วงหน่วยความจำ: 0x000c0000-0x000dffff (rw,ไม่สามารถเรียกล่วงหน้าได้,ปิดใช้งาน)
  IRQ: 192 (55080 เหตุการณ์)
  โมดูลนามแฝง: "pci:v00008086d00009BC4sv00001462sd000012C6bc03sc00i00"
  ข้อมูลไดรเวอร์ #0:
    สถานะไดรเวอร์: i915 ทำงานอยู่
    Cmd การเปิดใช้งานไดรเวอร์: "modprobe i915"
  สถานะการกำหนดค่า: cfg=new, avail=yes, need=no, active=unknown
 
การ์ดแสดงผลหลัก: #16

ไดรเวอร์ Ubuntu

$ อุปกรณ์ไดรเวอร์อูบุนตู
== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
โหมด: pci:v000010DEd00001E91sv00001462sd000012C6bc03sc00i00
ผู้จำหน่าย: NVIDIA Corporation
ไดรเวอร์: nvidia-driver-450-server - distro ไม่ฟรี
ไดรเวอร์: nvidia-driver-460 - แนะนำให้ใช้ distro ที่ไม่เสียค่าใช้จ่าย
ไดรเวอร์: nvidia-driver-470-server - distro ไม่ฟรี
ไดรเวอร์: nvidia-driver-470 - บุคคลที่สามไม่ฟรี
ไดรเวอร์: nvidia-driver-460-server - distro ไม่ฟรี
ไดรเวอร์: xserver-xorg-video-nouveau - ในตัว distro ฟรี

ขอบคุณ!

โปรดแจ้งให้เราทราบหากต้องการข้อมูลเพิ่มเติม เราจะพยายามอย่างเต็มที่เพื่อให้ข้อมูลดังกล่าว! ขอบคุณสำหรับความช่วยเหลือที่คุณสามารถให้ได้!

cc flag
ดูการเขียนที่ดี https://askubuntu.com/questions/1077061/how-do-i-install-nvidia-and-cuda-drivers-into-ubuntu/1077063#1077063 สำหรับการใช้ runfile เพื่อติดตั้ง CUDA โดยทั่วไป ให้ติดตั้งไดรเวอร์ Nvidia (470 สำหรับการ์ดของคุณ) จาก repos มาตรฐาน จากนั้น (เป็นทางเลือก) แทนที่ตำแหน่งเริ่มต้น (ระบบ) ของ runfile เป็นการตั้งค่า cuda ในเครื่องของคุณ ปฏิบัติต่อ CUDA เหมือนแอป มันไม่ได้กำหนดไดรเวอร์วิดีโอหรือคอมไพเลอร์ของระบบ คุณสามารถติดตั้งไฟล์ CUDA ทั้งหมดในเครื่อง จากนั้นเพิ่มการแทนที่ตามต้องการสำหรับ gcc เป็นต้นไปยัง CUDA/bin นั้น ซึ่งจะถูกวางไว้ในช่วงต้นของ PATH
oldfred avatar
cn flag
ตั้งแต่ลองใช้ไดรเวอร์ต่างๆ คุณได้ล้างข้อมูลทั้งหมดก่อนที่จะพยายามติดตั้งไดรเวอร์ใหม่หรือไม่ หากไม่กำจัดคุณจะได้รับข้อขัดแย้งและไม่มีอะไรทำงาน ติดตั้ง nVidia ล้างข้อมูลหากจำเป็น https://ubuntuforums.org/showthread.php?t=2383560&p=13735336#post13735336 ล้าง จากนั้นติดตั้งไดรเวอร์ที่แนะนำ
Benjamin Bray avatar
it flag
@oldfred ใช่ฉันล้างระหว่างการพยายามติดตั้งใหม่แต่ละครั้งโดยใช้ขั้นตอนที่แสดงในคำถามของฉัน มีเครื่องมือวินิจฉัยสำหรับค้นหาไดรเวอร์กราฟิกที่ติดตั้ง/ถอนการติดตั้งไม่ถูกต้องหรือไม่
Benjamin Bray avatar
it flag
@ ubfan1 ขอบคุณ -- แต่ทุกแหล่งอื่น ๆ ที่ฉันเคยเห็นบอกว่าการติดตั้งจาก runfile นั้นเป็นเรื่องใหญ่ เว้นแต่คุณจะรู้จริง ๆ ว่าคุณกำลังทำอะไรอยู่ (ซึ่งฉันไม่รู้จริง ๆ !) ฉันกังวลว่าอาจทำให้ระบบของฉันอยู่ในสถานะที่ยากต่อการวินิจฉัย/อัปเกรดในภายหลัง
Score:2
ธง it

ฉันรันสิ่งต่อไปนี้ในวันนี้ (หลังจากล้างข้อมูลตามที่อธิบายไว้ข้างต้น) และดูเหมือนว่าจะทำงานได้อีกครั้งหลังจากรีบูต:

sudo add-apt-repository ppa:graphics-drivers/ppa
อัปเดต sudo apt
sudo apt ติดตั้ง nvidia-driver-460

อย่าถามฉันว่าทำไมมันถึงได้ผล -- ฉันลองทำสิ่งเดียวกันเมื่อวานนี้โดยไม่ประสบความสำเร็จ

Paul avatar
us flag
ฉันมีประสบการณ์จำกัดและย้ายไปยัง Mint สำหรับระบบปฏิบัติการเดสก์ท็อปของฉัน แต่ปัญหาไดรเวอร์ Nvidia เหล่านี้ยังคงอยู่ใน Ubuntu และดีที่สุดฉันสามารถบอกรุ่นอื่นๆ ได้ อาจเป็นคำแนะนำที่ไม่เหมาะกับคุณ แต่อย่างน้อยพิจารณาว่าไม่ใช้ดูอัลบูตและพิจารณาย้ายไปยัง AMD GPU (หรือ Intel หากสามารถทำได้ทุกอย่างที่คุณต้องการ) และฉัน _know_ ว่ามันยากแค่ไหนสำหรับแล็ปท็อป
Score:0
ธง us

ฉันแก้ไขปัญหาด้วยการติดตั้งไดรเวอร์ใหม่และเปิดใช้งาน GPU ทั้งหมดผ่านไดรเวอร์ Nvidia:

  1. เรียกใช้คำสั่ง:

    sudo nvidia-config --enable-all-gpus
    
  2. ปิดและเปิดเครื่อง (ไม่รีบูต)

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา