第一步, 确认Tensorflow版本对应的三个版本信息: 驱动版本号, cuda版本号, cudnn版本号
到下面网址查看tf版本对应的两个版本信息
https://www.tensorflow.org/install/source_windows?hl=zh-cn#gpu
我用tensorflow_gpu-2.6.0, 对应的就是CUDA 11.2, cuDNN 8.1
https://developer.nvidia.com/cuda-toolkit-archive
https://developer.nvidia.com/rdp/cudnn-archive
两个先下载好, 然后找CUDA 11.2对应的驱动安装, 下面链接第2个table
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
CUDA 11.2.x 对应的版本号区间是 >=452.39, 到下面网址搜索对应显卡和对应版本的驱动
https://www.nvidia.cn/Download/Find.aspx?lang=cn
我下载的是GeForce Game Ready 472.12版本驱动, 在驱动信息里看到 NVCUDA64.DLL 版本信息是 11.4.136
wsl 版本安装:https://developer.nvidia.cn/cuda-downloads?target_os=Linux&target_arch=x86_64&Distribution=WSL-Ubuntu&target_version=2.0&target_type=deb_local
wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-wsl-ubuntu.pin
sudo mv cuda-wsl-ubuntu.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/12.2.2/local_installers/cuda-repo-wsl-ubuntu-12-2-local_12.2.2-1_amd64.deb
sudo dpkg -i cuda-repo-wsl-ubuntu-12-2-local_12.2.2-1_amd64.deb
sudo cp /var/cuda-repo-wsl-ubuntu-12-2-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cuda
安装好驱动, cuda, cudnn后, 设置系统环境变量, 在PATH里添加两个:
%CUDA_PATH%\bin
%CUDA_PATH%\lib\x64
检测是否安装成功
cmd命令行输入:nvidia-smi
在系统变量中,增加变量名TF_GEFORCE_GPU_ALLOW_GROWTH,取值为true
接下来是安装tensorflow_gpu
在conda里创建python 3.7环境, 在环境里安装tf, 我是手动下载的安装包, 下载对应py3.7版本的:
https://www.tensorflow.org/install/pip.html?hl=zh-cn#package-location
用pip安装下载的tf安装包即可
测试代码如下:
import tensorflow as tf
print(‘GPU’,tf.config.list_physical_devices(‘GPU’))
print(“Num GPUs Available: “, len(tf.config.experimental.list_physical_devices(‘GPU’)))
我只有一块GTX3060显卡,执行后返回:
GPU [PhysicalDevice(name=’/physical_device:GPU:0′, device_type=’GPU’)]
Num GPUs Available: 1
到此为安装成功。
安装pytorch对应cuda 11.1版本, 到以下链接下载安装包:
https://download.pytorch.org/whl/torch_stable.html
分别是:
torch-1.9.0+cu111-cp37-cp37m-win_amd64.whl
torchvision-0.10.0+cpu-cp37-cp37m-win_amd64.whl
torchaudio-0.9.0-cp37-cp37m-win_amd64.whl
用pip安装以上3个安装包即可
测试代码:
import torch
# 返回当前设备索引
print(torch.cuda.current_device())
# 返回GPU的数量
print(torch.cuda.device_count())
# 返回gpu名字,设备索引默认从0开始
print(torch.cuda.get_device_name(0))
# cuda是否可用,为true就可用了
print(torch.cuda.is_available())
#查看cudnn版本
print(torch.backends.cudnn.version())
#查看torch版本
print(torch.__version__)