第一步, 确认Tensorflow版本对应的三个版本信息: 驱动版本号, cuda版本号, cudnn版本号
到下面网址查看tf版本对应的两个版本信息 https://www.tensorflow.org/install/source_windows?hl=zh-cn#gpu
我用tensorflow_gpu-2.6.0, 对应的就是CUDA 11.2, cuDNN 8.1 https://developer.nvidia.com/cuda-toolkit-archive https://developer.nvidia.com/rdp/cudnn-archive
两个先下载好, 然后找CUDA 11.2对应的驱动安装, 下面链接第2个table
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
CUDA 11.2.x 对应的版本号区间是 >=452.39, 到下面网址搜索对应显卡和对应版本的驱动
https://www.nvidia.cn/Download/Find.aspx?lang=cn
我下载的是GeForce Game Ready 472.12版本驱动, 在驱动信息里看到 NVCUDA64.DLL 版本信息是 11.4.136
<span class="cudaBash">wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-wsl-ubuntu.pin
</span>
<span class="cudaBash">sudo mv cuda-wsl-ubuntu.pin /etc/apt/preferences.d/cuda-repository-pin-600
</span>
<span class="cudaBash">wget https://developer.download.nvidia.com/compute/cuda/12.2.2/local_installers/cuda-repo-wsl-ubuntu-12-2-local_12.2.2-1_amd64.deb
</span>
<span class="cudaBash">sudo dpkg -i cuda-repo-wsl-ubuntu-12-2-local_12.2.2-1_amd64.deb
</span>
<span class="cudaBash">sudo cp /var/cuda-repo-wsl-ubuntu-12-2-local/cuda-*-keyring.gpg /usr/share/keyrings/
</span>
<span class="cudaBash">sudo apt-get update
</span>
<span class="cudaBash">sudo apt-get -y install cuda</span>
安装好驱动, cuda, cudnn后, 设置系统环境变量, 在PATH里添加两个: %CUDA_PATH%\bin %CUDA_PATH%\lib\x64
检测是否安装成功
cmd命令行输入:nvidia-smi
在系统变量中,增加变量名TF_GEFORCE_GPU_ALLOW_GROWTH,取值为true
接下来是安装tensorflow_gpu
在conda里创建python 3.7环境, 在环境里安装tf, 我是手动下载的安装包, 下载对应py3.7版本的: https://www.tensorflow.org/install/pip.html?hl=zh-cn#package-location
用pip安装下载的tf安装包即可
测试代码如下: import tensorflow as tf print(‘GPU’,tf.config.list_physical_devices(‘GPU’)) print(“Num GPUs Available: “, len(tf.config.experimental.list_physical_devices(‘GPU’)))
我只有一块GTX3060显卡,执行后返回:
GPU [PhysicalDevice(name=’/physical_device:GPU:0′, device_type=’GPU’)] Num GPUs Available: 1 到此为安装成功。
安装pytorch对应cuda 11.1版本, 到以下链接下载安装包: https://download.pytorch.org/whl/torch_stable.html
分别是: torch-1.9.0+cu111-cp37-cp37m-win_amd64.whl torchvision-0.10.0+cpu-cp37-cp37m-win_amd64.whl torchaudio-0.9.0-cp37-cp37m-win_amd64.whl
用pip安装以上3个安装包即可
测试代码:
import torch
返回当前设备索引
print(torch.cuda.current_device())
返回GPU的数量
print(torch.cuda.device_count())
返回gpu名字,设备索引默认从0开始
print(torch.cuda.get_device_name(0))
cuda是否可用,为true就可用了
print(torch.cuda.is_available()) #查看cudnn版本 print(torch.backends.cudnn.version()) #查看torch版本 print(torch.version)