ฉันพบปัญหาขณะพยายามติดตั้งไดรเวอร์ GPU ของฉัน
ฉันติดตั้งไดรเวอร์ 495 NVIDIA ซึ่งเป็นไดรเวอร์ที่แนะนำสำหรับ Ubuntu
อย่างไรก็ตาม nvidia-smi ไม่พบไดรเวอร์ที่ฉันติดตั้ง ยังมีไดรเวอร์อยู่เมื่อเรียกใช้สถานะ DKMS:
user@server:~$ nvidia-smi
NVIDIA-SMI ล้มเหลวเนื่องจากไม่สามารถสื่อสารกับไดรเวอร์ NVIDIA ตรวจสอบให้แน่ใจว่าได้ติดตั้งและเรียกใช้ไดรเวอร์ NVIDIA ล่าสุดแล้ว
user@server:~$ สถานะ dkms
nvidia, 495.29.05, 5.11.0-41-generic, x86_64: ติดตั้งแล้ว
ผู้ใช้@เซิร์ฟเวอร์:~$ nvidia-debugdump -l
ข้อผิดพลาด: nvmlInit(): ไม่ได้โหลดไดรเวอร์
ผู้ใช้@เซิร์ฟเวอร์:~$ lspci -v | เกรปวีจีเอ
01:00.0 ตัวควบคุมที่เข้ากันได้กับ VGA: NVIDIA Corporation TU106 [GeForce RTX 2060 Rev. A] (rev a1) (prog-if 00 [ตัวควบคุม VGA])
ฉันยังได้รับสิ่งนี้:
user@server:~$ systemctl สถานะ nvidia-persistenced.service
â nvidia-persistenced.service - NVIDIA Persistence Daemon
โหลดแล้ว: โหลดแล้ว (/lib/systemd/system/nvidia-persistenced.service; เปิดใช้งาน; การตั้งค่าล่วงหน้าของผู้ขาย: เปิดใช้งาน)
ใช้งานอยู่: ล้มเหลว (ผลลัพธ์: exit-code) ตั้งแต่วันจันทร์ที่ 12-06-2021 14:50:17 EST; 38 นาทีที่แล้ว
กระบวนการ: 1109 ExecStart=/usr/bin/nvidia-persistenced --verbose (code=exited, status=1/FAILURE)
กระบวนการ: 1116 ExecStopPost=/bin/rm -rf /var/run/nvidia-persistenced/* (code=exited, status=0/SUCCESS)
06 ธันวาคม 14:50:17 เซิร์ฟเวอร์ systemd[1]: nvidia-persistenced.service: งานรีสตาร์ทตามกำหนดเวลา ตัวนับการรีสตาร์ทอยู่ที่ 5
6 ธันวาคม 14:50:17 เซิร์ฟเวอร์ systemd[1]: หยุดการทำงานของ NVIDIA Persistence Daemon
06 ธันวาคม 14:50:17 เซิร์ฟเวอร์ systemd[1]: nvidia-persistenced.service: เริ่มคำขอซ้ำเร็วเกินไป
06 ธันวาคม 14:50:17 เซิร์ฟเวอร์ systemd [1]: nvidia-persistenced.service: ล้มเหลวด้วยผลลัพธ์ 'exit-code'
6 ธันวาคม 14:50:17 เซิร์ฟเวอร์ systemd[1]: ไม่สามารถเริ่ม NVIDIA Persistence Daemon
ตรวจพบ GPU ของฉัน ฉันขาดขั้นตอนที่จำเป็นในการเชื่อมโยง nvidia-smi กับไดรเวอร์ Ubuntu NVIDIA หรือไม่
ฉันมี xorg.conf
ซึ่งฉันสามารถกำหนดขนาดความละเอียดได้ แต่ไม่สามารถเชื่อมต่อกับ nvidia-smi ได้
แจ้งให้เราทราบหากคุณต้องการข้อมูลเพิ่มเติมเกี่ยวกับปัญหานี้
ขอบคุณล่วงหน้า.
(แก้ไข):
ที่นี่คือ sudo lshw -c วิดีโอ
user@server:~$ sudo lshw -c วิดีโอ
*-แสดงไม่มีการอ้างสิทธิ์
คำอธิบาย: คอนโทรลเลอร์ที่รองรับ VGA
ผลิตภัณฑ์: TU106 [GeForce RTX 2060 Rev. A]
ผู้จำหน่าย: NVIDIA Corporation
รหัสทางกายภาพ: 0
ข้อมูลรถบัส: pci@0000:01:00.0
รุ่น: a1
ความกว้าง: 64 บิต
นาฬิกา: 33MHz
ความสามารถ: pm msi pciexpress vga_controller bus_master cap_list
การกำหนดค่า: เวลาแฝง = 0
ทรัพยากร: หน่วยความจำ:f6000000-f6ffffff หน่วยความจำ:e0000000-efffffff หน่วยความจำ:f0000000-f1ffffff ioport:e000(size=128) หน่วยความจำ:c0000-dffff