使用docker可以下载不同版本的cuda,方便不同的项目不同的人使用。
下载驱动很容易的,下面我们来介绍一种最简单的方法。
sudo ubuntu-drivers devices #显示可用驱动
sudo apt install nvidia-driver-525 #我这里选择的是525,大家按需操作即可
reboot # 需要重启一下
nvidia-smi #验证是否有驱动
参考网站里有很详细的解说,我们只再列出需要的代码。
sudo apt update #更新软件包
apt-get install ca-certificates curl gnupg lsb-release #安装docker依赖
curl -fsSL http://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg | sudo apt-key add - #添加Docker官方GPG密钥
sudo add-apt-repository "deb [arch=amd64] http://mirrors.aliyun.com/docker-ce/linux/ubuntu $(lsb_release -cs) stable" #添加Docker软件源
apt-get install docker-ce docker-ce-cli containerd.io #安装docker
sudo usermod -aG docker $USER #配置用户组(可选)可以不用sudo命令了,重启生效
systemctl start docker #运行
apt-get -y install apt-transport-https ca-certificates curl software-properties-common #安装工具
service docker restart #重启docker
sudo docker run hello-world #拉取hello-world
sudo docker images #显示拉取镜像
当输入这个命令时 sudo docker run hello-world ,出现下图就说明可以了。
注意:第一次udo docker run hello-world这个时,显示docker镜像没有hello-world,第二次拉取的时候才有,如图。不知道为什么。。。
$ curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \
sudo apt-key add -
$ distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
$ curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \
sudo tee /etc/apt/sources.list.d/nvidia-docker.list
$ sudo apt-get update
# 安装nvidia-docker2软件包并重新加载docker守护程序配置
$ sudo apt-get install -y nvidia-docker2
$ sudo pkill -SIGHUP dockerd
主要说明以下几个版本的不同之处,其他的按需索取即可,推荐devel版。docker拉取cuda官网
nvidia/cuda:11.1.1-cudnn8-runtime:
- 这是一个运行时镜像,适用于在已安装 CUDA 11.1.1 和 cuDNN 8 的环境中运行深度学习应用程序。该镜像包含运行时所需的库和工具,但不包含开发工具或头文件。
nvidia/cuda:11.1.1-cudnn8-devel:
- 这是一个开发镜像,适用于在已安装 CUDA 11.1.1 和 cuDNN 8 的环境中进行深度学习模型的开发。该镜像包含了编译和构建深度学习代码所需的开发工具、头文件和库。
nvidia/cuda:11.1.1-base:
- 这是一个基础镜像,提供了 CUDA 11.1.1 的基本环境,但没有安装 cuDNN 库。它可能适用于一些不依赖 cuDNN 的 CUDA 应用场景,或者用于构建自定义的 CUDA 环境。
nvidia/cuda:11.1.1-cudnn8-devel-ubuntu20.04:
- 这个版本在基础的 CUDA 11.1.1 和 cuDNN 8 的开发环境基础上,还基于 Ubuntu 20.04 操作系统。这使得该镜像不仅包含了 CUDA 和 cuDNN 的开发工具,还提供了 Ubuntu 20.04 操作系统的环境。
#进入镜像,一定要有--gpus all才能使用显卡
sudo docker run --gpus all -it nvidia/cuda:11.6.2-cudnn8-devel-ubuntu20.04
exit #退出镜像
这一部分看了网上很多的教程,看的我头晕,也走了不少弯路,这个应该是我总结出来的最简过程。
apt-get upgrate or apt update #更新软件包
wget https://repo.anaconda.com/archive/Anaconda3-2021.11-Linux-x86_64.sh #下载anaconda #有可能没有这个包 apt-get install wget 即可
sha256sum Anaconda3-2021.11-Linux-x86_64.sh #运行 sha256sum 命令来验证哈希值
source ~/.bashrc #激活安装
condo info #查看信息
安装文件
路径可自定义
conda init 【yes】 忘记选了?没事,下面教你解决
这里找不到conda命令。
vim ~/.bashrc #这里可能也没有vim,下载一个
打开后在文件末尾加上
export PATH="/root/anaconda3/bin:$PATH" #该路径实际为你的真实路径
source ~/.bashrc #更新配置
conda create -n myenv python=3.xx
创建完环境需要激活,可是上面的conda init忘记选了!
输入这几行就好了
root@2aa338b11794:/dockerfile# conda info | grep -i "zncuda11.6"
root@2aa338b11794:/dockerfile# source ~/anaconda3/etc/profile.d/conda.sh
root@2aa338b11794:/dockerfile# conda activate zncuda11.6
下面大家就可以下载torch了,记得和镜像的cuda环境一致哦,官网
先exit退出当前镜像。
docker ps -a #查看有哪些容器
docker commit contain_id newimagename
docker images #看看新的镜像有没有在
好的,下面进去就好了,环境什么的,都还在
现在就差不多了,后面需要补充的时候再补充。
欢迎关注,点赞哦!