Linux 平台上安装 NVIDIA GPU 驱动和 CUDA Toolkit

在 Linux 平台上安装 NVIDIA GPU 驱动和 CUDA Toolkit 的步骤如下:

### 1. 安装 NVIDIA GPU 驱动

#### 步骤 1: 更新系统

首先,确保你的系统是最新的:

```bash
sudo apt update
sudo apt upgrade
```

#### 步骤 2: 禁用 Nouveau 驱动

创建或编辑文件 `/etc/modprobe.d/blacklist-nouveau.conf`,添加以下内容:

```bash
blacklist nouveau
options nouveau modeset=0 # 内核模式设置(KMS)允许内核控制显示分辨率和显示模式等。如果设置为 0,会禁用这种设置,通常用于避免与专有的 NVIDIA 驱动冲突

#options nouveau nofb=1  # 帧缓冲用于图形模式显示,即让系统在文本模式下也支持基本的图形输出。当 nofb=1 时,会禁用 nouveau 驱动对帧缓冲的支持,这在某些系统上可以避免与其他显示管理器的兼容性问题。
```

然后更新 initramfs,更新 initramfs 的作用是确保系统启动过程中加载的驱动程序、内核模块和启动脚本与当前系统的配置和内核版本匹配,保障系统能够顺利启动:

```bash
sudo update-initramfs -u
```

重启系统:

```bash
sudo reboot

重启后,使用以下命令检查 nouveau 是否仍在使用

lsmod | grep nouveau

如果没有输出,则说明 nouveau 已成功禁用,可以继续安装 NVIDIA 驱动。
```

#### 步骤 3: 下载 NVIDIA 驱动

访问 [NVIDIA 驱动下载页面](https://www.nvidia.com/Download/index.aspx),选择你的 GPU 型号和操作系统,然后下载最新的驱动程序。

#### 步骤 4: 安装 NVIDIA 驱动

1. 进入下载目录并赋予执行权限:

   ```bash
   cd ~/Downloads
   chmod +x NVIDIA-Linux-x86_64-*.run
   ```

2. 停止 X 服务器,免驱动安装过程中出现图形界面冲突或错误:

   ```bash
   sudo service lightdm stop
   ```

   或者

   ```bash
   sudo systemctl stop gdm
   ```

3. 运行安装程序:

   ```bash
   sudo ./NVIDIA-Linux-x86_64-*.run
   ```

4. 按照安装向导完成安装。

#### 步骤 5: 重启系统

重启计算机:

```bash
sudo reboot
```

### 2. 安装 CUDA Toolkit

#### 步骤 1: 下载 CUDA Toolkit

访问 [NVIDIA CUDA Toolkit 下载页面](https://developer.nvidia.com/cuda-downloads),选择你的操作系统和版本,然后下载安装包。

#### 步骤 2: 安装 CUDA Toolkit

1. 进入下载目录并运行安装程序:

   ```bash
   cd ~/Downloads
   chmod +x cuda_*.run
   sudo ./cuda_*.run
   ```

2. 按照安装向导的提示进行安装。可以选择默认选项,通常会包括驱动安装、CUDA Toolkit 和示例代码。

#### 步骤 3: 配置环境变量

安装完成后,编辑 `~/.bashrc` 文件,将以下内容添加到文件末尾:

```bash
export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
```

然后运行以下命令使更改生效:

```bash
source ~/.bashrc
```

#### 步骤 4: 验证 CUDA 安装

运行以下命令检查 CUDA 是否安装成功:

```bash
nvcc -V
```

如果显示 CUDA 的版本信息,则说明安装成功。

### 3. 安装 cuDNN(可选)

如果你需要深度学习框架(如 TensorFlow 或 PyTorch),可以安装 cuDNN。访问 [NVIDIA cuDNN 下载页面](https://developer.nvidia.com/cudnn),下载适合你的 CUDA 版本的 cuDNN,然后按照说明进行安装。

### 总结

以上步骤涵盖了在 Linux 上安装 NVIDIA GPU 驱动和 CUDA Toolkit 的基本流程。如果在安装过程中遇到问题或需要更多信息,请告诉我!

报错问题:

错误1:

$ nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

情况1解决方法:

参考:Ubuntu:解决显卡驱动问题NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver._ubuntu nvidia-smi has failed because it couldn't c-CSDN博客

sudo apt-get install dkms
sudo dkms install -m nvidia -v 525.105.17
#这里的525.105.17是自己的显卡驱动版本

情况2解决方法2:

 要禁用nouveau,参加开头部分,nouveau不禁用也会出现在报备 

你可能感兴趣的:(深度学习,gpu算力)