ปัญหานี้เกิดขึ้นเมื่อฉันรีสตาร์ทเซิร์ฟเวอร์โน้ตบุ๊กระบบคลาวด์ในวันนี้
สามารถทำซ้ำได้โดยใช้ขั้นตอนด้านล่าง:
สร้างเซิร์ฟเวอร์ Google Cloud Notebook ด้วย Tensorflow หรือ Pytorch และ GPU
หลังจากเริ่มเซิร์ฟเวอร์ ให้เปิดคอนโซลไพธอน:
>>>นำเข้าไฟฉาย
>>> torch.cuda.is_available()
จริง
อุปกรณ์ CUDA มีให้บริการจนถึงปัจจุบัน
- รีสตาร์ทเซิร์ฟเวอร์ และเปิดสมุดบันทึกอีกครั้ง
>>>นำเข้าไฟฉาย
>>> torch.cuda.is_available()
/opt/conda/lib/python3.7/site-packages/torch/cuda/__init__.py:52: UserWarning: การเริ่มต้น CUDA: ข้อผิดพลาดที่ไม่รู้จัก CUDA - อาจเป็นเพราะสภาพแวดล้อมที่ตั้งค่าไม่ถูกต้อง เช่น เปลี่ยนตัวแปร env CUDA_VISIBLE_DEVICES หลังจากเริ่มโปรแกรม การตั้งค่าอุปกรณ์ที่มีอยู่เป็นศูนย์ (ทริกเกอร์ภายในที่ /opt/conda/conda-bld/pytorch_1614378098133/work/c10/cuda/CUDAFunctions.cpp:109)
ส่งคืน torch._C._cuda_getDeviceCount() > 0
เท็จ
nvidia-smi
คำสั่งทำงานได้ดี
+--------------------------------------------- ----------------------------+
| เวอร์ชันไดรเวอร์ NVIDIA-SMI 450.80.02: 450.80.02 เวอร์ชัน CUDA: 11.0 |
|---------------------------------------++---------------- ----------------------------+
| ชื่อ GPU ความคงทน-M| Bus-Id Disp.A | ผันผวน Uncorr ECC |
| Fan Temp Perf Pwr:การใช้งาน/ความจุ| การใช้งานหน่วยความจำ | GPU-Util Compute M. |
| | | MIG M. |
|==============================+================== =====+======================|
| 0 เทสลา T4 ปิด | 00000000:00:04.0 ปิด | 0 |
| ไม่ระบุ 43C P0 16W / 70W | 0MiB / 15109MiB | ค่าเริ่มต้น 0% |
| | | ไม่มี |
+--------------------------------------+-------- ----------------------------+
+--------------------------------------------- ----------------------------+
| กระบวนการ: |
| GPU GI CI ประเภท PID ชื่อกระบวนการ หน่วยความจำ GPU |
| รหัส ID การใช้ |
|================================================= ============================|
| ไม่พบกระบวนการทำงาน |
+--------------------------------------------- ----------------------------+
nvcc: ไดรเวอร์คอมไพเลอร์ NVIDIA (R) Cuda
ลิขสิทธิ์ (c) 2005-2020 NVIDIA Corporation
สร้างเมื่อ Thu_Jun_11_22:26:38_PDT_2020
เครื่องมือรวบรวม Cuda, รีลีส 11.0, V11.0.194
สร้าง cuda_11.0_bu.TC445_37.28540450_0
ปัญหานี้สามารถทำซ้ำได้โดยใช้ TensorFlow กรณีแบบนี้จะแก้ไขอย่างไร?