木楚子

「大模型学习」(10)LLM的量化（GPTQ、LLM.int8()、AWQ）不信你学不会！

前言

为什么要做量化？
1. 减少模型的存储空间和显存的占用。
2. 在显卡中，数据从HBM中加载到Tensor Core中计算，计算速度受限于数据加载的速度。通过对模型进行量化，减少HBM和Tensor Core之间的数值传输量，从而加快模型推理时间。
3. 显卡对整数运算速度快于浮点型数据，从而加快模型推理时间。
为什么量化对神经网络精度影响不大？
1.权重和输入经过归一化，数值范围较小
➤ 通常神经网络训练后会对输入和权重做标准化（Normalization），避免极端值，使得量化误差变小。

2.激活函数平滑误差影响
➤ 比如 ReLU、GELU 等非线性激活函数会压制或滤除部分噪声，量化带来的误差可能被自然平滑掉。

3.分类任务对绝对值不敏感
➤ 多数神经网络用于分类任务，只要“正确类别”的输出概率比其他类别高即可，不需要特别精确的数值。

PTQ 和 QAT

✅ PTQ（Post-Training Quantization，后训练量化）

特点：

不需要训练，只需一段校准数据（少量样本）。
对于训练好的模型进行量化处理（如 int8、int4）。
常用于部署阶段，简单快速。

流程：

收集小规模代表性数据作为校准集。
对模型的权重和激活分布做分析，计算 scale / zero point。
逐层或逐通道量化，生成量化模型。
可选微调（如 GPTQ、OBQ、AWQ 引入的重构或优化过程）。

✅ QAT（Quantization-Aware Training，量化感知训练）

特点：

在训练阶段加入量化模拟。
用“伪量化（fake quantization）”来近似量化行为。
可以 fine-tune 模型，学会适应量化误差。

流程：

在训练图中插入量化节点（如权重、激活模拟量化）。
前向传播中模拟量化影响（例如对激活值做 clipping）。
反向传播仍然基于 FP32 权重更新（STE 技术）。

量化感知训练：

PTQ的代表方法讲解

1. ZeroQuant

ZeroQuant 是一种针对大语言模型（LLM）部署和推理阶段的训练后量化（PTQ）技术框架主要目的是在不重新训练的前提下大幅降低模型精度（如INT8甚至INT4）而仍保持高精度。

ZeroQuant提出了多个版本：

名称	主要特点	支持精度
ZeroQuant	基础版，首次提出 PTQ 精准方案	INT8
ZeroQuant-V2	引入 block-wise 重构与非对称量化	INT4
ZeroQuant-V3	更进一步，结合 GPT 结构优化	INT4、NF4

ZeroQuant 的核心思想

以 ZeroQuant-V2 为例，主要包含以下关键点：

✅ 1. Block-wise Reconstruction（块级重构）

把模型中每层的 W（权重）矩阵分成多个小块，每个块单独量化并做重构。
比传统 layer-wise 更细粒度，有效减少精度损失。
使用重构损失，如 KL 散度作为度量标准来微调每块的 scale 和 zero-point。

✅ 2. 混合精度量化（Mixed-Precision）

不强制所有模块都用 INT4：比如 LayerNorm 和某些 sensitive 层仍保留 FP16/INT8。
比如：
- Attention QKV → INT4
- Output projection → INT8
- LayerNorm → FP16

✅ 3. 逐通道非对称量化

支持逐通道（per-channel）量化：为每个通道分配独立 scale。
使用 非对称量化（min-max 动态调整 zero point），更贴近实际权重分布。

✅ 4. 逐层误差控制

引入 量化敏感性分析（sensitivity-aware），找到最容易失真层，给它更高精度。
基于统计数据对每一层的激活和权重做误差追踪。
观察：激活值的变化范围远大于权重，因此需要更细粒度。
方法：
- 激活值 X：Token-wise（即横向，seq dim）
- 权重 W：Group-wise（即列向量）
优化手段：层级蒸馏（Layer-wise Distillation），对每层输出做MSE匹配，减少精度损失。
优势：
- 高粒度激活值量化能保留更多细节。
- 矩阵乘法结构设计利于低精度加速。

2. LLM.int8()

发现问题：激活值中存在“离群值”（Outliers），极大影响量化。
解决方案：混合精度量化：
- 离群值：用 FP16 保存，避免精度损失；
- 其余值：使用 INT8 存储和计算。
离群值特点（6.7B以上模型尤为严重）：
- 仅占 0.1%，但对 softmax 结果影响极大（top1下降20%）。
- 非对称分布（one-sided），幅值可达正常值的 20 倍。

LLM.int8() 的核心思想

混合精度量化（Mixed-Precision Quantization）

它 不是简单地把所有权重都压成 INT8，而是：

对每个线性层的每一列进行 重要性评估
对于 不重要的列（95%以上）：
- 用 INT8 表示
对于 重要的列（~5%）：
- 保留 FP16 精度

权重敏感性评估机制

通过小批量输入校准数据，计算量化误差对输出影响，识别：

哪些列量化后对模型输出影响大？哪些不影响？

这就是 LLM.int8() 的创新点 —— 量化选择机制！

实现

以一个 Linear 层为例：

权重矩阵 $\in \mathbb{R}^{n \times m}$
将每一列 $w_j$ 转换为：
- INT8 表示 $\hat{w}_j$ （若不重要）
- 保留 FP16 表示（若很重要）
  
  整体表示为：
  
  $W_{\text{int8}} + W_{\text{fp16}}$
  
  推理时：
  
  $\cdot (W_{\text{int8}} + W_{\text{fp16}})$

3. SmoothQuant

观察：激活值比权重要难量化。
方法：
- 引入缩放因子 $s$ ，调整激活值和权重的数值范围：
  - 激活值除以 $s$ ，权重乘以 $s$ ，保持矩阵乘结果不变。
- 通常 $s_j = \sqrt{|X_j| \cdot |W_j|}$ ，并设置超参 $\alpha = 0.5$
优点：
- 显著提高量化精度；
- 缩放常数可预先计算，避免运行时计算。

4. GPTQ（Groupwise Precision Training for Quantization）

前提：OBQ

Optimal Brain Quantization（OBQ）的流程，是一种以最小化模型输出误差为目标的后训练量化（PTQ）方法，其核心是通过最小化权重量化误差在整个模型输出（如 logits）上的影响，来实现高精度量化。OBQ逐层（Layer-wise）进行权重量化与输出拟合优化，依次处理每一层，直到整网完成。

下面是对 OBQ 流程的详细讲解（分步骤）：

第 1 步：收集校准数据

从真实数据或模拟数据中收集少量样本（如 100 条）
前向传播，记录每一层的输入激活 $X$

目的：构造真实输入空间，捕捉量化对输出的实际影响。

第 2 步：获取原始输出（浮点精度）

对当前层（如 Linear 层）使用浮点权重 $W$ 计算输出：

$Y = X W$

这作为参考输出。

第 3 步：初始化量化权重

对权重 $W$ 进行线性量化，得到初始量化权重 $W_q$ ：

$W_q = \text{Quant}(W, \text{scale}, \text{zero-point})$

可采用 per-channel、per-group 量化方式
支持 INT8 / INT4 等低位量化

第 4 步：误差重构优化（核心）

目标：找到最优的量化权重解，使得量化后的输出最接近原始输出 $Y$ 。

数学表达为一个最小二乘优化问题：

$\min_{\hat{W}_q} \| X \hat{W}_q - Y \|^2 \quad \text{s.t. } \hat{W}_q \in \text{quantized space}$

$\hat{W}_q$ ：在量化空间内逼近原始输出的最优解
这是一个 投影 + 修正问题，可用以下方式求解：
线性最小二乘 + clip 到量化区间
求解近似的连续最优 $W^*$ ：

$W^* = (X^TX)^{-1} X^TY$

将 $W^*$ 投影到量化空间，得到 $\hat{W}_q$

第 5 步：逐层更新模型

替换当前层的浮点权重为 $\hat{W}_q$
保留 scale 和 zero point（供推理阶段反量化）

第 6 步：全模型前向验证

将模型换成量化后的版本
在校准数据上跑一次完整前向，验证精度变化（如 logits 差异、Top-1 变化）

GPTQ量化算法

GPTQ 是一种无需训练的低比特后训练量化（Post-Training Quantization，PTQ）方法，广泛用于 LLaMA、OPT、BERT 等大型模型的 INT4 量化，尤其适合 Transformer 的 Linear 层权重量化。

✅核心思想：

GPTQ 的目标是对每一层的权重 $W$ 进行逐列量化，使得：

量化后的输出 $XW_q$ 尽可能接近原始输出 $X W$ ，且考虑量化误差对整体输出的影响最小。

对于一层线性变换（如 Linear 层）：

$Y = X W$

$\in \mathbb{R}^{n \times d_{\text{in}}}$ ：输入激活（采样的校准数据）
$\in \mathbb{R}^{d_{\text{in}} \times d_{\text{out}}}$ ：浮点权重
$W_q$ ：INT4 或 INT8 量化权重

GPTQ 逐列处理权重矩阵 $W$ 的每一列 $w_j$ ，以最小化：

$\min_{\hat{w}_j \in \text{quant space}} \| X \hat{w}_j - Xw_j \|^2$

但关键在于，它不仅考虑本列误差，还考虑误差对输出的影响，使用二阶信息（Hessian 近似）。

✅具体步骤

① 收集校准数据（X）

从样本集中抽取 $X$ （输入激活）
一般为 128 ~ 1024 条样本

② 构造输入协方差矩阵 $H$

GPTQ 关键：使用输入协方差 $H = X^T X$ 来估计量化误差的影响

$\in \mathbb{R}^{d_{\text{in}} \times d_{\text{in}}}$
实际中使用近似的对角矩阵 $\tilde{H} = \text{diag}(H)$ ，降低计算成本

③ 列优先贪心量化

对于权重矩阵 $[w_1, w_2, \dots, w_d]$ ，每次处理一个列 $w_j$ ：

- 第 1 步：量化列向量
将 $w_j$ 量化为 $\hat{w}_j$ ，在量化空间中选择最接近的向量：

$\hat{w}_j = \text{Quant}(w_j)$

可以是对称或非对称 INT4、INT8，支持 per-channel/group 量化。
- 第 2 步：误差补偿（Error Feedback）
将量化引入的误差反馈到后续列中：

$W_{j+1:\,d} \leftarrow W_{j+1:\,d} - \frac{(w_j - \hat{w}_j)^T H_{j+1:\,d, j}}{H_{jj}}$

这类似于在正交方向上“修正”后续列，使误差不会积累。

这个步骤就是 GPTQ 的亮点：

基于 Hessian 的权重误差传播修正，防止前面列的量化误差污染后面列

④ 重复直到所有列处理完毕

完成整层的量化，得到 $W_q$

⑤ 替换权重，验证模型输出

用 $W_q$ 替换原始 $W$
在校准集上比较 logits 差异、Top-1 精度变化

PyTorch 框架中的 GPTQ 示例流程（简略）

X = collect_calibration_activations(layer, data)  # shape [N, in_dim]
H = (X.T @ X) / N                                 # Hessian approximation
for j in range(W.shape[1]):
    w_j = W[:, j]
    w_hat_j = quantize_column(w_j)
    error = w_j - w_hat_j
    W[:, j+1:] -= (error.T @ H[:, j+1:]) / H[j, j]  # error feedback
    W[:, j] = w_hat_j

5.AWQ

其核心思想是：通过分析激活值的分布动态调整权重量化策略，显著降低量化误差，尤其适合GPT、LLaMA等百亿参数级模型。

核心原理

1. 传统量化的问题
权重平等量化：普通INT8量化对所有权重统一缩放，但实际中不同权重对模型输出的影响差异极大。
激活值分布不均：某些通道（Channel）或注意力头的激活值范围更大，需要更高精度。
2. AWQ的解决方案
保护关键权重：

通过统计激活值的幅度，识别对输出影响大的权重（如某些注意力头的Key/Value矩阵），对其保留更高精度（如INT4→INT8）。

按通道缩放Per-channel Scaling：

对每个权重通道单独计算缩放因子，而非全局统一缩放。
如何做？
识别激活的“重要区域”（高幅值、高敏感性）
- 比如通过观测校准样本输入，找出 activations 哪些维度影响最大

对重要的列或 group 的权重提前放大（scaling）

用一个缩放因子 $s_j$ 缩放列 $W_j$ ：

$W'_j = s_j \cdot W_j$
然后对 $W'_j$ 做量化：

$\hat{W}'_j = \text{Quantize}(W'_j)$
最后在推理时再除以 $s_j$ ，即：

$\approx X \cdot \left( \frac{1}{s_j} \cdot \hat{W}'_j \right)$

四、方法比较总结

方法	是否量化激活	是否量化权重	离群值处理	是否需要蒸馏	优点	缺点
ZeroQuant	✅（token-wise）	✅（group-wise）	❌	✅（层级蒸馏）	适用于多种场景	推理略慢
LLM.int8()	✅（混合精度）	✅（INT8）	✅	❌	精度好	推理速度下降20%
SmoothQuant	✅（缩放值处理）	✅	❌	❌	缩放处理简单有效	需提前统计缩放值
GPTQ	❌	✅（INT4）	❌	✅（优化最小误差）	高压缩率	训练复杂

x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
日更006 终极训练营day3 懒cici
人生创业课（2）今天的主题：学习方法一：遇到有用的书，反复读，然后结合自身实际，列践行清单，不要再写读书笔记思考这本书与我有什么关系，我在哪些地方能用到，之后我该怎么用方法二：读完书没映像怎么办?训练你的大脑，方法：每读完一遍书，立马合上书，做一场分享，几分钟都行对自己的学习要求太低，要逼自己方法三：学习深度不够怎么办？找到细分领域的榜样，把他们的文章、书籍、产品都体验一遍，成为他们的超级用户，向
day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
《极简思维》第三部分小洋苏兮
整理你的人际关系如何改善人际关系？摘录：因为人际关系问题是人们生活中不快乐的主要原因。感想：感觉这个说的挺对，之前我总是埋头学习，不管舍友不管自己的合作伙伴的一些事情，但实际上，这学期关注了之后好多了摘录：“亲密关系与社交会让你健康而快乐。这是基础。太过于关注成就或不太关心人际关系的人都不怎么快乐。基本上来说，人类就是建立在人脉关系上的。”感想：但是如果有时想的太多就不太好，要以一个开放的心态跟别
你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。霖霖z
打卡人:周云日期:2018年11月09日【日精进打卡第180天】【知～学习】《六项精进》0遍共214遍《通篇》1遍共106遍《大学》2遍共347遍《坚强工作，温柔生活》ok《不抱怨的世界》104-108页《经典名句》你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。【行～实践】一、修身：（对自己个人）1、坚持打卡二、齐家：（对家庭和家人）打扫卫生，接送孩子，洗衣做饭，陪
贫穷家庭的孩子考上985以后会怎样？ Mellisa蜜思言
我出生在一个贫穷的农村家庭，据我妈说，我出生的时候才4斤多，而她生完我以后月子里就瘦到70斤。家里一直很穷，父母都是在菜市场卖菜的，家里还有几亩地种庄稼的。我很小开始就要去帮忙，暑假的生活就是帮忙去卖菜和割稻谷，那时候自己对于割稻谷这种事情有着莫名的恐惧，生怕自己长大以后还是每年都要过着割稻谷这种日子。父母因为忙于生计无暇顾及我的学习，幸好我因为看到他们这样子的生活，内心里有深深的恐惧感，驱使着我
2019-06-05 第十七把巴鲁克
今天去实验田里实习，见到了福寿螺真的可怕且牛皮，六级也快来了，说实话还是害怕。我昨天考了环工原理，真的太难了，太烦了，理工科真的难，烦。实验报告还是没写，要抓紧速度抓紧时间，还是应该学会努力学习，远离一些不上进的事物。
为什么焦虑、抑郁、自残的青少年越来越多？精神健康
很多家长觉得没缺孩子吃的穿的，他们有安稳的生活，他们有什么可焦虑、抑郁的，但现在的孩子，学习压力越来越大，每天休息的时间越来越少，出现焦虑抑郁是很正常的。从发展的角度看，青少年时期，人的身体、情绪，智力、人格都急剧发展，正从未成熟走向成熟，情绪起伏不定，易冲动，再者，由于缺乏生活经验，以及来自于家长、学校、社会的各种要求和压力，从而不知所措，心中的焦虑、恐惧、彷徨得不到及时的排解，从而导致心理上的
读书打卡《别想太多啦》 chenchen_68ed
第一，世间之事，不去尝试永远不知道其中的奥秘，在尝试中有失败是必然的。如果担心失败，那什么都学不会。第二，经历的失败越多，越会对失败者抱有宽容的态度，“原来如此，我也经历过类似的失败啦，那只是暂时的”。经历越多失败的长者，越能包容别人，这也就是所谓的“越年长越宽容”。成熟的人，就是在众多失败经历中不断学习，并接纳别人的失败。对于他人的小小过失不吹毛求疵，自己的心态会更加平和。在不断失败中学习，让自
2023-01-26 胡喜平
我觉得《可见的学习》一书确实从底层逻辑说清楚了，教学的本质。可是太多术语和概念，一时间难以消化啊。而且知道和懂得有距离，运用就更不行了，需要高手和专家的指导。我需要多听听新课标的讲座了，来反复印证。读论文也有了一点点灵感，明天修改我的论文。
平静得接受自己的笨拙 20190118 晨间日记吴伯符
图片发自App最近做了一个关于微习惯的分享，这里有八个字：微量开始，超额完成。这里的言下之意其实是要你在一开始的时候，平静地接受自己的笨拙。接受自己的笨拙，理解自己的笨拙，放慢速度尝试，观察哪里可以改进，再反复练习，观察自己哪里可以再进一步改进，再反复…这是学习一切技能的必须的过程。这里的两个关键点是：1.尽快的开始这个过程，这就能够用到微习惯的微量开始。2.尽快的度过这个过程，这就需要用到超额完
二十四节气组诗谷雨离陌_6639
图片来源网络，若侵犯了你的权益，请联系我删除6.谷雨文/离陌背上行囊背上如行囊的我从此任行程马不停蹄今天家乡的田野春雨快马加鞭播下希望的种子观音不语目送着我和夏天一道在观音山出关图片来源网络，若侵犯了你的权益，请联系我删除你好啊，我是离陌，已然在懵懂中走过了16年的岁月，为了珍惜当下的每一秒，所以立志做一名终身学习者。文学对于我来说是一种信仰，诗歌是我的生命。人生之道，四通八达，即入文学，自当持之
你好，2020年瑄瑄妍妍的妈咪
早上好，今天是2020年的第一天，也就是元旦，新年新的一天开始了。新的开始，重新规划未来的一年。从今天开始，用了一个新的记账软件，之前的随手记软件，也没有删除，只是重新下载了一个别的软件，开始一个新的记账旅程，对于理财开支，有个新的规划。通过小红书视频软件，学习了不少育儿知识，和各种不同的美食，以后动手制作，给宝宝做健康美味的营养餐。学习方面，继续学英语吧！虽然是抽出时间学的，进度也比较慢，但是积
常规笔记本和加固笔记本的区别 luchengtech 电脑三防笔记本加固计算机加固笔记本
在现代科技产品中，笔记本电脑因其便携性和功能性被广泛应用。根据使用场景和需求的不同，笔记本可分为常规笔记本和加固笔记本，二者在多个方面存在显著区别。适用场景是区分二者的重要标志。常规笔记本主要面向普通消费者和办公人群，适用于家庭娱乐、日常办公、学生学习等相对稳定的室内环境。比如，人们在家用它追剧、处理文档，学生在教室用它完成作业。而加固笔记本则专为特殊行业设计，像军事、野外勘探、工业制造、交通运输
《云襄传》：云襄做的局是浑水摸鱼吗？书生号贺
云襄入南都是要浑水摸鱼吗？他是云台的高材生吗？他为啥笃定师父一定会让他留在南都？他为啥觉得他能够做局成功？他是在经商吗？还是在经营人心与欲望？云襄是云台弟子，云台属千门的一支，另一支叫凌渊，云台教人经商之道，重智慧，凌渊以武力取胜，但倍受打压。云襄学习十五年，下高山奔越州，途经南洋，因恩人闻聪被害，囚于白驹镇，念于情分，被卷入这样一个局面里，结识了舒亚南与金十两，于是，复仇小组成立，目标是南都漕帮
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
闭组进行时... 李亚青_强化班
今天是2019年12月1号距离开始三月学习的日子:2019年10月07,已经过去将近两个月，回顾这一阶段的学习，收获了什么?又学会了什么呢?图片发自App我想，收获最大的就是身边这一群人吧,有和蔼可亲的学姐，贴心的学长，嬉戏打闹，玩的不亦乐乎，但也同样认真踏实学习小伙伴图片发自App本以为在这样的时刻，有太多太多话，太多太多想法想要表达，可言到此处，又觉得似乎没有什么想要说的了还是那句话，幸运遇到
2021-10-23 赵甄文的幸福
秀荣感恩日记Day42[烟花]感恩语录感恩自己有能力有好身体，可以到处走动，做自己想做的事情10.23感恩日记今天做的事情瑜伽一小时户外散步一小时泡脚20分钟学习打卡和孩子沟通[爱心]感动的瞬间今天瑜伽回来，发现老公在厨房里做鱼。每次老公有时间休息的时候都会给我做硬菜。刘姐约我一起去公园散步晒太阳。虽然完美错过，但心里还是暖暖的。每天睁开眼打开手机，先去自己的群里逛一逛，每每发现有人点赞或者互动都
孤独的守候怒吼的生命
孤独了时光岁月了寂寞带来了惆怅那些孤独的日子里我们珍惜奋斗起来品味人生的真谛做到更好奋斗当中的你是那么努力格外自律学习起来五彩斑斓那些日子时光匆匆人生的机会很多需要把握痛苦的回忆记得住那些忧愁孤苦五一的日子寂寞当中的你时光荏苒独自带给我荒草学习起来努力奋斗可是我们做的还不够把握发展生活带给我们更多希望静静的述说你的故事你的精彩人生当中我们总是努力把握生活带给我们更多的学习生活当中我们奋斗可是做的还
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
2018-08-29精进打卡米兰王
姓名:王兰英【日精进打卡第25天】【知～学习】《六项精进》1遍共39遍《大学》1遍共50遍【经典名句分享】一切都是最好的安排。【行～实践】一、修身：（对自己个人）1，散步1小时。2，每天坚持读书。二、齐家：（对家庭和家人）1，指导孩子开车。2，和家人一起逛超市。三、建功：（对工作）用心做好每件事。｛积善｝：发愿从2018年8月5日起1年内365个善事。今日1善，累计27善。【省～觉悟】正人先正己。
陶勇：要不要参加分班考试学习？看完再说。陶勇
每年到了升学季，有很多培训机构都特别忙，为什么呢？因为有成千上万的学生，会选择升学前的分班考试的培训。比如说，小升初的孩子，到了暑假，很多孩子都会去选择一个初中，初一的分班考试的培训，那考入高中的孩子也有很多孩子会选择这种新高一的分班考试的培训。当然了，我个人认为这种选择并不是孩子自身的选择，主要还是家长的选择。当然也有少数孩子会对自己有比较高的要求，他们也会主动的去选择。为什么要去上分班考试的这
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
求解——妊娠纹霜哪个牌子好？皮肤专家推荐的热门秘诀！ zhangxing0100
妊娠纹会严重影响女性的美观，那孕期的女性朋友该如何避免减少妊娠纹的出现呢?下面美腹丽人小编为大家分享了预防妊娠纹的方法，赶紧一起来学习吧!一、预防妊娠纹的饮食习惯1、多食用对皮肤内胶原纤维有利的食品来增强皮肤的弹性。2、控制糖分摄入，少吃色素含量高的食物。3、早晚两杯脱脂牛奶，多食用维丰富的蔬菜、水果和富含维生素及矿物质的食物，增加细胞膜的通透性和皮肤的新陈代谢功能。4、正确的喝水习惯可以提速皮肤
2023-01-07 阿诗玛_6209
姓名：赵丽娟【日精进打卡第1783天】【知～学习】读书《经营与会计》ok《活法》3-47-8【经典名句】执着追求并从中得到最大快乐的人，才是成功者。——梭罗一、修身：（对自己个人）1、保持心态平和.2、坚持打卡.坚持读书。3、早晨喝杯温水.4、坚持烫脚，养成早睡早起的习惯.二、齐家：三、建功：（对工作）｛积善｝：发愿从2018年1月28日起见善行善，今日0善。【省～觉悟】1,睡觉时把手机放到离自己
认命修运每日一省（16）星_6329
命每个人的命都是父母带来的，我们每个人都没有权利选择父母，没有权利选择自己的出生。一个人从出生的那一刻就注定了你的命。我所说的认命，就是客观的接受自己的父母，接受自己的家庭。不对抗，不较劲。有些人是含着金汤匙出生的，有些人刚一出生拥有的财富可能是我们一生都得不到的。有些人是踩着泥坑出生的。有些人一出生就是等着继承皇位的。运在我们成长的过程当中，我们付出努力，学习知识，成长自己，帮助他人。我们有权利
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多