day35

一、模型可视化
  1. 用 torchinfo 看模型结构

    能快速打印模型各层的输入输出形状、参数数量,还会统计总参数量、计算量等信息,像给模型做 “结构清单”,方便确认架构是否正确。就像查户口本,能直接列出模型每一层的 “家庭成员”(输入输出尺寸、参数数量),还能算全家总参数、占多大内存,一看就知道模型搭得对不对。
  2. 看权重分布

    将模型参数(权重)的数值分布绘制成直方图或热力图,通过观察参数是否集中、有无异常值,判断训练过程是否正常(如是否出现梯度问题)。模型里的参数(权重)就像一堆数字零件,把它们画成直方图或热图,能看出这些数字有没有扎堆、有没有极端值,判断训练时是不是出问题了(比如参数全崩了)。
二、训练进度条实现方式
  1. 手动编写进度条

    自己控制进度条的显示逻辑,根据迭代次数计算完成比例,适合需要高度自定义的场景。
  2. 自动生成进度条(tqdm 库)

    借助工具库快速生成可视化进度条,自动显示完成进度、预计剩余时间等信息,代码简洁且美观。
三、模型推理

模型训练完成后进行推理时,需调用model.eval()切换至评估模式,关闭 dropout、批量归一化等训练阶段的正则化操作,确保推理结果稳定,避免因随机因素导致预测结果波动。训练完用模型预测时,要喊一声 “考试模式启动”(model.eval()),关掉训练时的 “作弊功能”(比如 dropout 随机删神经元、BN 层的动态统计),让模型每次输出都稳稳的,不会忽高忽低。

浙大疏锦行-CSDN博客

你可能感兴趣的:(python训练营,人工智能)