服务器配置采集

一、GPU信息收集

  1. 查看GPU型号和驱动信息

nvidia-smi -q > gpu_info.txt

(输出会包含GPU型号、显存、驱动版本、温度等信息)

  1. 查看CUDA版本

nvcc --version 2>&1 | tee cuda_version.txt

如果未安装 nvcc,可通过路径查看:

ls -l /usr/local/cuda* >> cuda_version.txt

二、系统硬件信息

  1. CPU信息

lscpu > cpu_info.txt
  1. 内存信息

sudo dmidecode -t memory > memory_info.txt
  1. 磁盘和存储

lsblk > disk_layout.txt
df -h >> disk_layout.txt
# 查看硬盘型号(需root)
sudo smartctl -a /dev/sda >> disk_info.txt
  1. 主板和BIOS

sudo dmidecode -t baseboard > motherboard.txt
sudo dmidecode -t bios >> bios.txt

三、系统与软件环境

  1. 操作系统版本

cat /etc/os-release > os_version.txt
uname -a >> os_version.txt
  1. 内核版本和模块

uname -r > kernel_version.txt
lsmod >> kernel_modules.txt
  1. 已安装驱动列表

dkms status >> drivers.txt

四、网络配置

ip addr > network_config.txt
route -n >> network_config.txt

五、汇总报告

将所有信息打包:

tar -czvf server_config.tar.gz *.txt

注意事项:

  1. 权限问题:部分命令需要 sudo,确保你有管理员权限。

  2. 敏感信息:检查输出的文件是否包含敏感数据(如IP地址)。

  3. 工具缺失:如果缺少命令(如 nvidia-smidmidecode),需先安装:

    sudo apt install nvidia-utils dmidecode smartmontools  # Ubuntu/Debian
    sudo yum install nvidia-driver dmidecode smartmontools # CentOS/RHEL

将生成的 server_config.tar.gz 提交即可完整展示服务器配置。如果需要进一步分析,可提供关键输出片段。

你可能感兴趣的:(服务器,运维)