服务器中深度学习环境的配置

安装流程

11.17 日,周末去高校参加学术会议,起因, 由于使用了某高校内的公共有线网络, 远程连接服务器后,黑客利用 ssh 开放的 22 端口, 篡改了主机的配置, 使得只要一连上网络, 服务器cpu 会被占满,估计被人用去挖矿。

该端口开放的本意是用来pycharm 远程调试的。

不同于一般的主机安装过程,服务器上一般只会使用单系统,
这里以 super_mircro 超威主板 x299 为例子,安装ubuntu20.04 系统时,

1.2 镜像制作

使用 balenaEtcher, 进行烧录镜像,不要在使用 ultraso (优选通);

https://etcher.balena.io/

1.2 显示器连接

这里需要声明的是, 一定要使用的两头都是 VGA 接口的,不要转接。
并且部分 Dell 的显示器不能正常显示, 但是笔者换了其他型号的 Dell 显示器或者 Aoc 显示器,则可以正常显示了。

在没有安装时显卡驱动时, 此时默认显示器使用的是主板的集显,

如果出现 iKVM doesn't support add-on VGA device. Please change the D-SUB connector to Add-on VGA device... 描述时,

此时,开机时 按住 DEl 键盘进入bios 中设置:
在 选项 --》 高级中, 选择 Onboard VGA;

服务器中深度学习环境的配置_第1张图片
图中的 cpu SLOT7 PCIE 等选项, 可以在主板上的卡槽标注的位置,
图中可以看到该主板上共有 四个显卡的连接位置, 其中SLOT7 PCIE 代表的便是最上面卡槽的位置。

在插拔显卡过程 中, 一定 要先把显卡槽上卡扣按下去,即按平才可以往上抬起显卡。

1.3 系统安装

正常显示之后, 选择系统安装的启动盘:
即图中的 UEFI: AI mass storge ,partition 2

然后选择第一个选项 Ubuntu 安装,
其中第二个选项 ubuntu (safe graphs) 是ubuntu 为了兼容哪些不支持的显卡(比方说英特尔锐炬)类型所准备的, 而华硕的显卡是被ubuntu 20.04 支持的。

服务器中深度学习环境的配置_第2张图片

此外,在安装过程中, 如果出现一直转圈 等待的情况,
则是ubuntu 在联网更新, 办法是将网络断开, 完成安装。

2. 显卡驱动安装

在上述工作完成之后, 正常情况下,通过vga 是可以正常显示的,
这里需要声明的是, 一定要使用的两头都是 VGA 接口的,不要转接,
并且部分 Dell 的显示器不能正常显示, 但是换了其他的 Dell 显示器或者 Aoc 显示器,则可以正常显示了。

2.1 拷贝显卡驱动程序

在正常进入系统后,安装如下顺序进行操作:

  1. 拷贝显卡驱动程序到Document 文件下面;
  2. 更换阿里镜像源;
  3. 安装 gcc, make 显卡驱动程序安装过程中会使用到;
  4. 禁用nouveau;

如果, 有人顺序做反了, 先禁用了Nouveau ,还么有拷贝 显卡驱动程序到系统中, 导致无法进入桌面环境。

则可以使用如下方式:

  1. 进入tty 字符界面;
  2. cat -n 使用带行号的方式,输出刚才禁用的文件;
  3. sed -i , 注释刚才写入的 禁用Nouveau 对应的行号;

2.2 安装显卡驱动

之后的过程,便可以参考这里:

环境配置

3. 配置深度学习环境

如果在重装系统之前,已经使用如下方式,将各个项目对应的深度学习环境已经配置好了,

  • 导出当前环境依赖的库

导出所有第三方库的方法:
在控制台执行以下语句:pip freeze > requirements.txt(名字可以随便自己取)

  • 安装安装所有的第三库 pip install -r requirements.txt

你可能感兴趣的:(#,环境相关,服务器,深度学习,运维)