Score:0

ไม่สามารถใช้ nvidia-smi กับไดรเวอร์ nvidia 495 Ubuntu 20.04 LTS

ธง br

ฉันพบปัญหาขณะพยายามติดตั้งไดรเวอร์ GPU ของฉัน

ฉันติดตั้งไดรเวอร์ 495 NVIDIA ซึ่งเป็นไดรเวอร์ที่แนะนำสำหรับ Ubuntu

อย่างไรก็ตาม nvidia-smi ไม่พบไดรเวอร์ที่ฉันติดตั้ง ยังมีไดรเวอร์อยู่เมื่อเรียกใช้สถานะ DKMS:

user@server:~$ nvidia-smi
NVIDIA-SMI ล้มเหลวเนื่องจากไม่สามารถสื่อสารกับไดรเวอร์ NVIDIA ตรวจสอบให้แน่ใจว่าได้ติดตั้งและเรียกใช้ไดรเวอร์ NVIDIA ล่าสุดแล้ว

user@server:~$ สถานะ dkms
nvidia, 495.29.05, 5.11.0-41-generic, x86_64: ติดตั้งแล้ว

ผู้ใช้@เซิร์ฟเวอร์:~$ nvidia-debugdump -l
ข้อผิดพลาด: nvmlInit(): ไม่ได้โหลดไดรเวอร์

ผู้ใช้@เซิร์ฟเวอร์:~$ lspci -v | เกรปวีจีเอ
01:00.0 ตัวควบคุมที่เข้ากันได้กับ VGA: NVIDIA Corporation TU106 [GeForce RTX 2060 Rev. A] (rev a1) (prog-if 00 [ตัวควบคุม VGA])

ฉันยังได้รับสิ่งนี้:

user@server:~$ systemctl สถานะ nvidia-persistenced.service
â nvidia-persistenced.service - NVIDIA Persistence Daemon
     โหลดแล้ว: โหลดแล้ว (/lib/systemd/system/nvidia-persistenced.service; เปิดใช้งาน; การตั้งค่าล่วงหน้าของผู้ขาย: เปิดใช้งาน)
     ใช้งานอยู่: ล้มเหลว (ผลลัพธ์: exit-code) ตั้งแต่วันจันทร์ที่ 12-06-2021 14:50:17 EST; 38 นาทีที่แล้ว
    กระบวนการ: 1109 ExecStart=/usr/bin/nvidia-persistenced --verbose (code=exited, status=1/FAILURE)
    กระบวนการ: 1116 ExecStopPost=/bin/rm -rf /var/run/nvidia-persistenced/* (code=exited, status=0/SUCCESS)

06 ธันวาคม 14:50:17 เซิร์ฟเวอร์ systemd[1]: nvidia-persistenced.service: งานรีสตาร์ทตามกำหนดเวลา ตัวนับการรีสตาร์ทอยู่ที่ 5
6 ธันวาคม 14:50:17 เซิร์ฟเวอร์ systemd[1]: หยุดการทำงานของ NVIDIA Persistence Daemon
06 ธันวาคม 14:50:17 เซิร์ฟเวอร์ systemd[1]: nvidia-persistenced.service: เริ่มคำขอซ้ำเร็วเกินไป
06 ธันวาคม 14:50:17 เซิร์ฟเวอร์ systemd [1]: nvidia-persistenced.service: ล้มเหลวด้วยผลลัพธ์ 'exit-code'
6 ธันวาคม 14:50:17 เซิร์ฟเวอร์ systemd[1]: ไม่สามารถเริ่ม NVIDIA Persistence Daemon

ตรวจพบ GPU ของฉัน ฉันขาดขั้นตอนที่จำเป็นในการเชื่อมโยง nvidia-smi กับไดรเวอร์ Ubuntu NVIDIA หรือไม่

ฉันมี xorg.conf ซึ่งฉันสามารถกำหนดขนาดความละเอียดได้ แต่ไม่สามารถเชื่อมต่อกับ nvidia-smi ได้

แจ้งให้เราทราบหากคุณต้องการข้อมูลเพิ่มเติมเกี่ยวกับปัญหานี้

ขอบคุณล่วงหน้า.

(แก้ไข):

ที่นี่คือ sudo lshw -c วิดีโอ

user@server:~$ sudo lshw -c วิดีโอ
  *-แสดงไม่มีการอ้างสิทธิ์
       คำอธิบาย: คอนโทรลเลอร์ที่รองรับ VGA
       ผลิตภัณฑ์: TU106 [GeForce RTX 2060 Rev. A]
       ผู้จำหน่าย: NVIDIA Corporation
       รหัสทางกายภาพ: 0
       ข้อมูลรถบัส: pci@0000:01:00.0
       รุ่น: a1
       ความกว้าง: 64 บิต
       นาฬิกา: 33MHz
       ความสามารถ: pm msi pciexpress vga_controller bus_master cap_list
       การกำหนดค่า: เวลาแฝง = 0
       ทรัพยากร: หน่วยความจำ:f6000000-f6ffffff หน่วยความจำ:e0000000-efffffff หน่วยความจำ:f0000000-f1ffffff ioport:e000(size=128) หน่วยความจำ:c0000-dffff
vLev avatar
br flag
ฉันใช้ `sudo apt install nvidia-driver-495` หลังจากเห็นมันใน `ubuntu-drivers devices` ฉันยังล้างข้อมูลไดรเวอร์หลายครั้ง ซึ่งอาจหมายความว่าบัญชีดำบางส่วนถูกซ่อนอยู่ที่ไหนสักแห่ง ฉันพบปัญหาที่คล้ายกันนี้: https://forums.developer.nvidia.com/t/nvidia-driver-is-not-loaded-ubuntu-18-10/70495
cc flag
คุณสามารถตอบกลับในโพสต์ต้นฉบับ ความคิดเห็นอาจถูกลบ ตรวจสอบสิ่งอื่นที่ไม่ใช่ nvidiafb แน่นอน (fgrep nvidia /etc/modprobe.d/*) - ไม่ควรมี วิดีโอ lshw -c แสดงไดรเวอร์ใด เพิ่มเป็นข้อความออกในการโพสต์ต้นฉบับของคุณด้วยแท็กรหัส การบูตแบบปลอดภัยปิดอยู่หรือไม่ การอัปเดต Windows อาจเปิดใช้งานอีกครั้ง
vLev avatar
br flag
ขอบคุณ! ฉันเพิ่งอัปเดตโพสต์ด้วย `lshw`
heynnema avatar
ru flag
Nvidia 495 เป็นซอฟต์แวร์เบต้า ล้างและติดตั้ง 470.86... หรือเวอร์ชันล่าสุดที่ลงท้ายด้วยศูนย์ ใช้แท็บไดรเวอร์เพิ่มเติม `Software & Updates` หรือดูที่ https://www.nvidia.com/en-us/geforce/drivers/คุณอาจต้องปิดการใช้งาน Secure Boot ใน BIOS ของคุณ
Score:0
ธง br

ดังที่เฮย์นเนมากล่าวไว้

ฉันปิดใช้งาน Secure boot ในไบออส UEFI ของฉัน nvidia-smi ตอนนี้ใช้งานได้ดีอย่างสมบูรณ์!

user@server:~$ nvidia-smi
จ. 6 ธ.ค. 18:14:06 น. 2564
+--------------------------------------------- ----------------------------+
| เวอร์ชันไดรเวอร์ NVIDIA-SMI 495.29.05: 495.29.05 เวอร์ชัน CUDA: 11.5 |
|---------------------------------------++---------------- ----------------------------+
| ชื่อ GPU ความคงทน-M| Bus-Id Disp.A | ผันผวน Uncorr ECC |
| Fan Temp Perf Pwr:การใช้งาน/ความจุ| การใช้งานหน่วยความจำ | GPU-Util Compute M. |
| | | MIG M. |
|==============================+================== =====+======================|
| 0 NVIDIA GeForce ... เปิด | 00000000:01:00.0 เปิด | ไม่มี |
| 0% 49C P8 17W / 190W | 179MiB / 5931MiB | ค่าเริ่มต้น 0% |
| | | ไม่มี |
+--------------------------------------+-------- ----------------------------+

+--------------------------------------------- ----------------------------+
| กระบวนการ: |
| GPU GI CI ประเภท PID ชื่อกระบวนการ หน่วยความจำ GPU |
| รหัส ID การใช้ |
|================================================= ============================|
| 0 ไม่มี ไม่มี ไม่มี 1152 G /usr/lib/xorg/Xorg 35MiB |
| 0 ไม่มี ไม่มี 1889 G /usr/lib/xorg/Xorg 48MiB |
| 0 ไม่มี ไม่มี 2016 G /usr/bin/gnome-shell 84MiB |
+--------------------------------------------- ----------------------------+

ขอบคุณสำหรับความช่วยเหลือ!

NovHak avatar
cn flag
คุณหมายถึงคุณปิด Secure Boot ใช่ไหม? เนื่องจากการลบคีย์ทั้งหมดจะทำให้ Secure Boot อยู่ใน _Setup Mode_ ดังนั้นจึงเป็นการหยุดการบังคับใช้ SB แต่นั่นค่อนข้างรุนแรงและต้องมีการเติมฐานข้อมูลคีย์ใหม่ในภายหลัง หากคุณตัดสินใจที่จะเปิดใช้งานอีกครั้ง เอาล่ะ วิธีที่ดีที่สุดในการปิดใช้งานการตรวจสอบ Secure Boot บน Ubuntu คือการดำเนินการ `mokutil --disable-validation` แต่อย่างไรก็ตาม ควรทำงานร่วมกับ Secure Boot คุณอาจไม่มีรหัสลายเซ็นโมดูล : `update-secureboot-policy --new-key`

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา