在 Linux 平台上安装 NVIDIA GPU 驱动和 CUDA Toolkit 的步骤如下:
#### 步骤 1: 更新系统
首先,确保你的系统是最新的:
```bash
sudo apt update
sudo apt upgrade
```
创建或编辑文件 `/etc/modprobe.d/blacklist-nouveau.conf`,添加以下内容:
```bash
blacklist nouveau
options nouveau modeset=0 # 内核模式设置(KMS)允许内核控制显示分辨率和显示模式等。如果设置为 0
,会禁用这种设置,通常用于避免与专有的 NVIDIA 驱动冲突
#options nouveau nofb=1 # 帧缓冲用于图形模式显示,即让系统在文本模式下也支持基本的图形输出。当 nofb=1
时,会禁用 nouveau
驱动对帧缓冲的支持,这在某些系统上可以避免与其他显示管理器的兼容性问题。
```
然后更新 initramfs,更新 initramfs
的作用是确保系统启动过程中加载的驱动程序、内核模块和启动脚本与当前系统的配置和内核版本匹配,保障系统能够顺利启动:
```bash
sudo update-initramfs -u
```
重启系统:
```bash
sudo reboot
重启后,使用以下命令检查 nouveau
是否仍在使用
lsmod | grep nouveau
如果没有输出,则说明 nouveau
已成功禁用,可以继续安装 NVIDIA 驱动。
```
访问 [NVIDIA 驱动下载页面](https://www.nvidia.com/Download/index.aspx),选择你的 GPU 型号和操作系统,然后下载最新的驱动程序。
1. 进入下载目录并赋予执行权限:
```bash
cd ~/Downloads
chmod +x NVIDIA-Linux-x86_64-*.run
```
2. 停止 X 服务器,免驱动安装过程中出现图形界面冲突或错误:
```bash
sudo service lightdm stop
```
或者
```bash
sudo systemctl stop gdm
```
3. 运行安装程序:
```bash
sudo ./NVIDIA-Linux-x86_64-*.run
```
4. 按照安装向导完成安装。
重启计算机:
```bash
sudo reboot
```
#### 步骤 1: 下载 CUDA Toolkit
访问 [NVIDIA CUDA Toolkit 下载页面](https://developer.nvidia.com/cuda-downloads),选择你的操作系统和版本,然后下载安装包。
#### 步骤 2: 安装 CUDA Toolkit
1. 进入下载目录并运行安装程序:
```bash
cd ~/Downloads
chmod +x cuda_*.run
sudo ./cuda_*.run
```
2. 按照安装向导的提示进行安装。可以选择默认选项,通常会包括驱动安装、CUDA Toolkit 和示例代码。
#### 步骤 3: 配置环境变量
安装完成后,编辑 `~/.bashrc` 文件,将以下内容添加到文件末尾:
```bash
export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
```
然后运行以下命令使更改生效:
```bash
source ~/.bashrc
```
#### 步骤 4: 验证 CUDA 安装
运行以下命令检查 CUDA 是否安装成功:
```bash
nvcc -V
```
如果显示 CUDA 的版本信息,则说明安装成功。
### 3. 安装 cuDNN(可选)
如果你需要深度学习框架(如 TensorFlow 或 PyTorch),可以安装 cuDNN。访问 [NVIDIA cuDNN 下载页面](https://developer.nvidia.com/cudnn),下载适合你的 CUDA 版本的 cuDNN,然后按照说明进行安装。
### 总结
以上步骤涵盖了在 Linux 上安装 NVIDIA GPU 驱动和 CUDA Toolkit 的基本流程。如果在安装过程中遇到问题或需要更多信息,请告诉我!
$ nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
参考:Ubuntu:解决显卡驱动问题NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver._ubuntu nvidia-smi has failed because it couldn't c-CSDN博客
sudo apt-get install dkms
sudo dkms install -m nvidia -v 525.105.17
#这里的525.105.17是自己的显卡驱动版本
要禁用nouveau,参加开头部分,nouveau不禁用也会出现在报备