DuHz

深度神经网络模型量化

模型量化的基本概念

模型量化技术作为一种重要的模型压缩方法，在降低计算复杂度和提高执行效率方面显示出巨大价值。模型量化的核心思想是将模型参数和激活值从高精度表示（通常是32位浮点数FP32）转换为低精度表示（如8位整数INT8或更低位宽），从而减少模型存储空间并加速推理过程。

从数学角度看，量化可以被视为一种映射函数 $Q$ ，它将连续的浮点数值域 $\mathcal{R}$ 映射到离散的整数值域 $\mathcal{Q}$ ：

$\mathcal{R} \subset \mathbb{R} \rightarrow \mathcal{Q} = \{q_0, q_1, ..., q_{n-1}\} \subset \mathbb{Z}$

其中， ${q_0, q_1, ..., q_{n-1}\}$ 是量化后的离散值集合。从信息论的角度看，量化本质上是一种有损压缩，将连续信号的信息压缩到有限比特位宽中，不可避免地会引入信息损失，即量化误差。

量化过程可以通过复合函数表示，包含编码（量化）和解码（解量化）两个步骤：

$\text{Int}(\mathcal{E}(x))$
$\hat{x} = \mathcal{D}(Q(x))$

其中， $\mathcal{E}: \mathbb{R} \rightarrow \mathbb{R}$ 是编码函数， $\text{Int}$ 是取整操作， $\mathcal{D}: \mathbb{Z} \rightarrow \mathbb{R}$ 是解码函数， $x$ 是原始浮点数， $Q (x)$ 是量化后的整数， $\hat{x}$ 是解量化后的浮点数近似值。

从率失真理论（Rate-Distortion Theory）角度，量化问题可以形式化为在给定位宽 $b$ （率）的约束下，最小化量化误差（失真）：

$\min_{\mathcal{E}, \mathcal{D}} \mathbb{E}_{x \sim p(x)}[d(x, \hat{x})] \quad \text{s.t.} \quad H(Q(x)) \leq b$

其中， $\hat{x})$ 是失真度量（通常使用均方误差）， $H (Q (x))$ 是量化输出的熵， $p (x)$ 是输入数据的分布。

均匀量化（线性量化）

均匀量化是最常见的量化方法，其特点是量化值在目标范围内均匀分布。其基本原理是将浮点数范围 $x_{min}, x_{max}]$ 线性映射到整数范围 $0, 2^b-1]$ （无符号量化）或 $2^{b-1}, 2^{b-1}-1]$ （有符号量化），其中 $b$ 是量化后的位宽。

无符号均匀量化

对于无符号均匀量化，量化过程可以表示为：

$\text{clip}\left(\text{round}\left(\frac{r - r_{min}}{r_{max} - r_{min}} \times (2^b - 1)\right), 0, 2^b - 1\right)$

其中， $r$ 是原始浮点数， $r_{min}$ 和 $r_{max}$ 分别是浮点数范围的下界和上界， $q$ 是量化后的整数， $\text{clip}$ 函数确保量化结果在有效范围内。解量化过程则为：

$\hat{r} = r_{min} + \frac{q}{2^b - 1} \times (r_{max} - r_{min})$

通常，我们引入量化比例因子 $S$ 和零点偏移 $Z$ 来简化上述公式：

$\frac{r_{max} - r_{min}}{2^b - 1}$
$\text{round}\left(\frac{-r_{min}}{S}\right)$

则量化过程可以重写为：

$\text{clip}\left(\text{round}\left(\frac{r}{S} + Z\right), 0, 2^b - 1\right)$

解量化过程为：

$\hat{r} = S \times (q - Z)$

从信号处理的角度，均匀量化可以看作是一种非线性采样过程，将连续信号离散化为有限级别。量化误差 $\hat{r} - r$ 可以建模为加性量化噪声，在高分辨率量化下，该噪声近似服从均匀分布：

$\sim \mathcal{U}\left(-\frac{S}{2}, \frac{S}{2}\right)$

量化噪声的功率为：

$\sigma_e^2 = \mathbb{E}[e^2] = \frac{S^2}{12} = \frac{(r_{max} - r_{min})^2}{12 \cdot (2^b - 1)^2}$

这表明量化噪声功率与量化步长的平方成正比，与位宽的平方成反比。

有符号均匀量化

对于有符号均匀量化，量化过程可以表示为更复杂的数学形式：

$\text{clip}\left(\text{round}\left(\frac{r - r_{min}}{r_{max} - r_{min}} \times (2^b - 1) - 2^{b-1}\right), -2^{b-1}, 2^{b-1}-1\right)$

解量化过程为：

$\hat{r} = r_{min} + \frac{q + 2^{b-1}}{2^b - 1} \times (r_{max} - r_{min})$

引入量化比例因子 $S$ 和零点偏移 $Z$ 后：

$\frac{r_{max} - r_{min}}{2^b - 1}$
$\text{round}\left(\frac{-r_{min}}{S} - 2^{b-1}\right)$

量化和解量化过程可以简化为：

$\text{clip}\left(\text{round}\left(\frac{r}{S} + Z\right), -2^{b-1}, 2^{b-1}-1\right)$
$\hat{r} = S \times (q - Z)$

从量化编码理论角度，均匀量化的Lloyd-Max迭代算法可以表述为：给定数据分布 $p (r)$ 和初始量化边界 ${b_0, b_1, ..., b_{2^b}\}$ ，迭代更新量化重建值和边界：

$r_i = \frac{\int_{b_i}^{b_{i+1}} r \cdot p(r) dr}{\int_{b_i}^{b_{i+1}} p(r) dr}, \quad i = 0, 1, ..., 2^b-1$
$b_i = \frac{r_{i-1} + r_i}{2}, \quad i = 1, 2, ..., 2^b-1$

对于均匀分布的数据，Lloyd-Max算法收敛到均匀量化；但对于非均匀分布，如神经网络中常见的近似高斯分布或拉普拉斯分布，均匀量化不是最优的。

对称均匀量化

对称均匀量化是均匀量化的一个特例，其假设数据范围关于零对称，即 $r_{min} = -r_{max}$ 。在这种情况下，零点偏移 $Z$ 简化为特定值，量化比例因子 $S$ 的计算也变得更加简洁：

$\frac{2 \cdot r_{max}}{2^b - 1}$
$\begin{cases} 0, & \text{for signed quantization} \\ 2^{b-1}, & \text{for unsigned quantization} \end{cases}$

对称量化的量化和解量化过程可以简化为：

$\text{clip}\left(\text{round}\left(\frac{r}{S}\right), -2^{b-1}, 2^{b-1}-1\right)$
$\hat{r} = S \times q$

对于满足特定条件的神经网络（如使用ReLU激活函数的网络），可以证明在最小化量化误差的意义下，最优的非对称量化方案会趋近于对称量化。具体地，当权重分布近似为零均值高斯分布时，量化范围 $r_{min}, r_{max}]$ 的最优设置为：

$r_{max} = -r_{min} = \alpha \cdot \sigma_w$

其中 $\sigma_w$ 是权重的标准差， $\alpha$ 是与置信度相关的系数，通常取2-4。通过微分量化噪声功率关于 $\alpha$ 的导数并令其为零，可以得到最优 $\alpha$ 值：

$\frac{d}{d\alpha}\left(\frac{(2\alpha\sigma_w)^2}{12 \cdot (2^b - 1)^2} + 2 \int_{\alpha\sigma_w}^{\infty} (r - \alpha\sigma_w)^2 \frac{1}{\sqrt{2\pi}\sigma_w}e^{-\frac{r^2}{2\sigma_w^2}}dr\right) = 0$

这个最优解取决于数据分布和量化位宽，需要通过数值方法求解。

非均匀量化

非均匀量化考虑了数据的分布特性，在数据密集区域分配更多的量化级别，在数据稀疏区域分配较少的量化级别，从而在相同位宽下获得更高的量化精度。

对数量化

对数量化利用对数函数的非线性特性，在接近零的区域提供更高的精度。其基本思想是将浮点数先转换到对数空间，然后进行均匀量化。

对于正数部分，量化过程可以表示为非线性映射：

$q_+ = \text{clip}\left(\text{round}\left(k \times \log_b\left(1 + \frac{|r|}{\epsilon}\right)\right), 0, 2^{b-1}-1\right), \quad r > 0$

其中， $k$ 是缩放因子， $b$ 是对数的底数（通常选择2）， $\epsilon$ 是防止对数参数为零的小正数。

完整的对数量化考虑正负数的处理，可以表示为：

$\begin{cases} \text{sign}(r) \cdot \text{clip}\left(\text{round}\left(k \times \log_b\left(1 + \frac{|r|}{\epsilon}\right)\right), 0, 2^{b-1}-1\right), & r \neq 0 \\ 0, & r = 0 \end{cases}$

其中符号位占用1位，数值部分占用 $b - 1$ 位。解量化过程为：

$\hat{r} = \text{sign}(q) \cdot \epsilon \cdot \left(b^{\frac{|q|}{k}} - 1\right)$

从信息论角度，对数量化实际上是根据Weber-Fechner定律设计的，该定律指出人类对刺激的感知与刺激强度的对数成正比。类似地，对数量化对相对变化较大的区域（通常是大数值区域）进行粗量化，对相对变化小的区域（通常是小数值区域）进行精细量化。

对于服从拉普拉斯分布的数据：

$\frac{1}{2b}e^{-\frac{|r|}{b}}$

可以证明，最优的非均匀量化方案应该按照数据的概率密度函数的立方根分布量化级别，即：

$p_q(q) \propto p(r)^{1/3}$

这导致量化边界满足：

$\int_{b_i}^{b_{i+1}} p(r)^{1/3} dr = \frac{1}{2^b} \int_{-\infty}^{\infty} p(r)^{1/3} dr$

对于拉普拉斯分布，这一最优量化方案近似于对数量化。

基于聚类的非均匀量化

基于聚类的非均匀量化方法通过聚类算法自动发现数据的分布特征，为不同的数据区域分配合适的量化级别。

K-means量化

K-means量化是一种典型的基于聚类的量化方法，其目标是最小化量化均方误差：

$\min_{C, S} \sum_{i=1}^{n} \min_{j \in \{1,2,...,k\}} \|r_i - c_j\|^2$

其中， $C = \{c_1, c_2, ..., c_k\}$ 是 $k = 2^b$ 个聚类中心， $S = \{S_1, S_2, ..., S_k\}$ 是聚类划分，满足 $S_j = \{i : \arg\min_{j'} \|r_i - c_{j'}\|^2 = j\}$ 。

K-means算法的迭代过程可以表示为：

初始化聚类中心 $C^{(0)} = \{c_1^{(0)}, c_2^{(0)}, ..., c_k^{(0)}\}$
对于每次迭代 $t$ ，计算聚类划分：
$S_j^{(t)} = \{i : \arg\min_{j'} \|r_i - c_{j'}^{(t-1)}\|^2 = j\}$
更新聚类中心：
$c_j^{(t)} = \frac{1}{|S_j^{(t)}|} \sum_{i \in S_j^{(t)}} r_i$
重复步骤2-3直至收敛

K-means量化的量化过程可以表示为查找最近的聚类中心：

$\arg\min_{j \in \{1,2,...,k\}} \|r - c_j\|$

解量化过程则是直接映射到对应的聚类中心：

$\hat{r} = c_{q(r)}$

从矢量量化理论角度，K-means量化实际上是在最小化下面的期望失真度量：

$\mathbb{E}_{r \sim p(r)}[\|r - \hat{r}\|^2] = \sum_{j=1}^{k} \int_{V_j} \|r - c_j\|^2 p(r) dr$

其中， $V_j$ 是第 $j$ 个Voronoi区域，定义为与中心 $c_j$ 距离最近的点集：

$V_j = \{r : \|r - c_j\| \leq \|r - c_{j'}\|, \forall j' \neq j\}$

最优量化方案应满足以下两个必要条件：

最近邻条件： $q(r) = \arg\min_{j} \|r - c_j\|$
质心条件： $c_j = \frac{\int_{V_j} r p(r) dr}{\int_{V_j} p(r) dr}$

乘积量化（Product Quantization）

乘积量化是一种更复杂的非均匀量化方法，其核心思想是将高维向量分解为多个低维子向量，然后对每个子向量独立量化。这种方法的数学表示更为复杂。

假设原始向量 $\mathbf{r} \in \mathbb{R}^d$ 可以分解为 $m$ 个子向量： $\mathbf{r} = [\mathbf{r}^1, \mathbf{r}^2, ..., \mathbf{r}^m]$ ，其中每个子向量 $\mathbf{r}^j \in \mathbb{R}^{d/m}$ （假设 $d$ 能被 $m$ 整除）。

对于每个子向量空间 $\in \{1, 2, ..., m\}$ ，应用K-means算法得到 $k_j$ 个聚类中心 ${c_1^j, c_2^j, ..., c_{k_j}^j\}$ 。量化过程为：

$q^j(\mathbf{r}^j) = \arg\min_{i \in \{1,2,...,k_j\}} \|\mathbf{r}^j - c_i^j\|$

完整的量化向量是所有子向量量化结果的组合：

$Q(\mathbf{r}) = [q^1(\mathbf{r}^1), q^2(\mathbf{r}^2), ..., q^m(\mathbf{r}^m)]$

整个向量的量化编码可以表示为一个 $m$ 元组： $i_1, i_2, ..., i_m)$ ，其中 $i_j = q^j(\mathbf{r}^j)$ 。这种编码方式的总位宽为 $\sum_{j=1}^{m} \log_2 k_j$ 位。

从信息论角度，乘积量化本质上是在进行一种结构化的矢量量化，其理论上可以达到的率失真性能受限于以下不等式：

$\geq \frac{1}{2} \log_2 \frac{|\Sigma|}{(2\pi e)^d D^d}$

其中， $R$ 是编码率（每维度的平均比特数）， $D$ 是平均失真， $\Sigma$ 是数据的协方差矩阵。

乘积量化通过子空间独立量化的方式近似这一界限，其失真度量可以分解为：

$D_{PQ} = \sum_{j=1}^{m} D_j$

其中， $D_j$ 是第 $j$ 个子空间的量化失真。这种分解假设子空间之间相互独立，在实际应用中通常通过适当的空间变换（如PCA）来近似满足这一假设。

基于分布的非均匀量化

基于分布的非均匀量化方法根据数据的概率分布特性设计量化策略，使量化后的数据分布接近原始分布。

最小化量化误差

基于分布的量化可以形式化为最小化预期量化误差的优化问题，这可以通过变分优化方法求解：

$\min_{c_1, c_2, ..., c_k, \tau_1, \tau_2, ..., \tau_{k-1}} \mathbb{E}_{r \sim p(r)}[(r - \hat{r})^2] = \min_{c_1, c_2, ..., c_k, \tau_1, \tau_2, ..., \tau_{k-1}} \int_{-\infty}^{\infty} (r - \hat{r})^2 p(r) dr$

其中， ${c_1, c_2, ..., c_k\}$ 是量化表示值， $\{\tau_1, \tau_2, ..., \tau_{k-1}\}$ 是量化阈值，满足：

$\hat{r} = c_i \text{ if } \tau_{i-1} < r \leq \tau_i$

通过对优化目标关于 $c_i$ 和 $\tau_i$ 分别求导并令其为零，可以得到最优量化方案应满足的条件：

$\frac{\partial}{\partial c_i} \int_{\tau_{i-1}}^{\tau_i} (r - c_i)^2 p(r) dr = 0 \Rightarrow c_i = \frac{\int_{\tau_{i-1}}^{\tau_i} r \cdot p(r) dr}{\int_{\tau_{i-1}}^{\tau_i} p(r) dr}$

$\frac{\partial}{\partial \tau_i} \left[ \int_{\tau_{i-1}}^{\tau_i} (r - c_i)^2 p(r) dr + \int_{\tau_i}^{\tau_{i+1}} (r - c_{i+1})^2 p(r) dr \right] = 0$

求解后得到：

$\tau_i = \frac{c_i + c_{i+1}}{2}$

这组方程表明，最优量化表示值应为每个量化区间内数据的条件期望，而最优量化阈值应是相邻量化表示值的中点。通过迭代求解这两组方程，可以得到最优的非均匀量化方案，这就是Lloyd-Max算法的本质。

从信息论角度，当量化位宽足够高时，最优非均匀量化的量化点密度应与数据概率密度的立方根成正比：

$\rho(r) \propto p(r)^{1/3}$

基于这一原理，可以设计出适合各种分布的非均匀量化方案。例如，对于拉普拉斯分布 $\frac{1}{2b}e^{-\frac{|r|}{b}}$ ，最优的量化点密度为 $\rho(r) \propto e^{-\frac{|r|}{3b}}$ ，这表明在靠近零的区域应安排更密集的量化级别。

基于熵的量化

基于熵的量化方法试图最大化量化后数据的信息熵，从而保留原始数据的信息量。其目标函数可以表示为复杂的优化问题：

$\max_{c_1, c_2, ..., c_k, \tau_1, \tau_2, ..., \tau_{k-1}} H(Q(r)) = -\sum_{i=1}^{k} P(Q(r) = c_i) \log_2 P(Q(r) = c_i)$

其中， $c_i) = \int_{\tau_{i-1}}^{\tau_i} p(r) dr$ 是量化后数据落入第 $i$ 个量化级别的概率。

最大熵量化的一个特例是均匀概率量化，即使得每个量化级别被选中的概率相等：

$c_i) = \frac{1}{k}, \forall i \in \{1, 2, ..., k\}$

这等价于求解以下方程组：

$\int_{\tau_{i-1}}^{\tau_i} p(r) dr = \frac{1}{k}, \forall i \in \{1, 2, ..., k\}$

对于连续型分布，这可以进一步简化为：

$\tau_i = F^{-1}\left(\frac{i}{k}\right)$

其中， $F^{-1}$ 是数据累积分布函数的逆函数。

这种量化方法在信息论意义上最大限度地保留了原始数据的信息，但不一定最小化均方误差。实际应用中，可以结合熵最大化和误差最小化的目标，设计混合优化方案：

$\min_{c_1, c_2, ..., c_k, \tau_1, \tau_2, ..., \tau_{k-1}} \mathbb{E}[(r - \hat{r})^2] - \lambda H(Q(r))$

其中， $\lambda$ 是平衡两个目标的权重参数。这种混合优化方案在理论上可以获得更好的率失真性能，但求解复杂度较高。

其他量化方法

除了上述方法外，神经网络量化还有许多其他技术，以下介绍几种理论上更为复杂的方法。

混合精度量化

混合精度量化针对神经网络中不同层或不同类型的参数采用不同的量化精度。其基本思想是根据每层对最终精度的敏感度，分配不同的位宽。这一问题可以形式化为一个复杂的离散优化问题：

$\min_{\{b_1, b_2, ..., b_L\} \in \mathcal{B}} \mathcal{L}(Q_{\{b_1, b_2, ..., b_L\}}(\mathbf{W})) \quad \text{s.t.} \quad \sum_{l=1}^{L} C(b_l) \leq C_{budget}$

其中， $b_l$ 是分配给第 $l$ 层的位宽， $\mathcal{B}$ 是可选位宽集合， $\mathcal{L}$ 是模型损失函数， $Q_{\{b_1, b_2, ..., b_L\}}$ 表示使用指定位宽进行量化的操作， $C(b_l)$ 是使用位宽 $b_l$ 的计算成本， $C_{budget}$ 是总计算预算。

由于这是一个NP难问题，通常采用启发式方法或强化学习方法求解近似最优解。例如，可以基于每层的敏感度指标分配位宽：

$s_l = \frac{\partial \mathcal{L}}{\partial b_l} \approx \frac{\mathcal{L}(Q_{\{b_1, ..., b_l + \Delta b, ..., b_L\}}(\mathbf{W})) - \mathcal{L}(Q_{\{b_1, ..., b_l, ..., b_L\}}(\mathbf{W}))}{\Delta b}$

位宽分配策略可以基于敏感度和计算成本的比率：

$b_l = \arg\max_{b \in \mathcal{B}} \frac{s_l(b)}{C(b)}$

从理论上讲，混合精度量化可以视为针对每层设计最优码本的问题，其理论最优解应满足：

$\frac{\partial \mathcal{L} / \partial b_1}{\partial C / \partial b_1} = \frac{\partial \mathcal{L} / \partial b_2}{\partial C / \partial b_2} = ... = \frac{\partial \mathcal{L} / \partial b_L}{\partial C / \partial b_L}$

这表明在最优配置下，增加任何一层的位宽所带来的性能提升与计算成本增加的比率应相等。

动态量化

动态量化在推理时动态确定量化参数，而不是预先确定。这种方法特别适合于激活值的量化，因为激活值在不同输入下有较大变化。

从数学上看，动态量化可以表示为一个依赖于输入的量化函数：

$Q_{\theta}(r, \mathbf{x}) = \text{round}\left(\frac{r}{S(\mathbf{x}, \theta)} + Z(\mathbf{x}, \theta)\right)$

其中， $S(\mathbf{x}, \theta)$ 和 $Z(\mathbf{x}, \theta)$ 是基于输入 $\mathbf{x}$ 和参数 $\theta$ 计算的量化参数。这些参数可以由神经网络直接预测：

$[S(\mathbf{x}, \theta), Z(\mathbf{x}, \theta)] = f_{\theta}(\mathbf{x})$

其中， $f_{\theta}$ 是一个参数为 $\theta$ 的辅助神经网络。

动态量化可以看作是一种自适应的非均匀量化，其理论最优性可以通过条件率失真理论分析。对于输入 $\mathbf{x}$ 条件下的数据分布 $p(r|\mathbf{x})$ ，最优的条件量化方案应满足：

$S(\mathbf{x}) = \frac{r_{max}(\mathbf{x}) - r_{min}(\mathbf{x})}{2^b - 1}$
$Z(\mathbf{x}) = \text{round}\left(\frac{-r_{min}(\mathbf{x})}{S(\mathbf{x})}\right)$

其中， $r_{min}(\mathbf{x})$ 和 $r_{max}(\mathbf{x})$ 是条件分布 $p(r|\mathbf{x})$ 的最小值和最大值。在实践中，通常使用统计估计值，如：

$r_{min}(\mathbf{x}) \approx \min_{i} r_i(\mathbf{x})$
$r_{max}(\mathbf{x}) \approx \max_{i} r_i(\mathbf{x})$

或者使用更稳健的估计：

$r_{min}(\mathbf{x}) \approx \mu(\mathbf{x}) - \alpha \cdot \sigma(\mathbf{x})$
$r_{max}(\mathbf{x}) \approx \mu(\mathbf{x}) + \alpha \cdot \sigma(\mathbf{x})$

其中， $\mu(\mathbf{x})$ 和 $\sigma(\mathbf{x})$ 分别是条件分布的均值和标准差， $\alpha$ 是超参数。

量化感知训练

量化感知训练（Quantization-Aware Training, QAT）在训练过程中考虑量化效应，以减小量化误差。其基本思想是在前向传播中模拟量化操作，但在反向传播中使用直通估计器（Straight-Through Estimator, STE）保持梯度流动。

数学上，QAT的前向传播为一个复合函数：

$\hat{r} = g(Q(r)) = g(\text{round}(f(r)))$

其中， $f$ 是预处理函数， $g$ 是后处理函数。

反向传播时，由于取整操作的梯度几乎处处为零，使用STE近似梯度：

$\frac{\partial \hat{r}}{\partial r} = \frac{\partial g}{\partial Q} \cdot \frac{\partial Q}{\partial r} \approx \frac{\partial g}{\partial Q} \cdot \frac{\partial f}{\partial r}$

这相当于在梯度传播中"跳过"取整操作。更精确地说，STE可以表示为：

$\frac{\partial \mathcal{L}}{\partial r} = \frac{\partial \mathcal{L}}{\partial \hat{r}} \cdot \begin{cases} \frac{\partial g}{\partial Q} \cdot \frac{\partial f}{\partial r}, & \text{if } f_{min} \leq f(r) \leq f_{max} \\ 0, & \text{otherwise} \end{cases}$

其中， $f_{min}, f_{max}]$ 是量化操作的有效输入范围。

从优化理论角度，QAT可以看作是求解以下双层优化问题：

$\min_{\mathbf{W}} \mathcal{L}(Q(\mathbf{W}))$

其中， $\mathbf{W}$ 是模型参数， $Q$ 是量化操作。这可以通过交替优化的方式求解，即先固定量化操作 $Q$ ，优化参数 $\mathbf{W}$ ，然后固定参数，更新量化操作的参数（如量化范围）。

从理论上讲，QAT的全局最优解应该导致量化模型在原始任务上的性能最大化，但由于问题的非凸性和离散性，通常只能找到局部最优解。

量化误差分析

量化不可避免地会引入误差，理解这些误差的性质和大小对于设计有效的量化策略至关重要。

量化噪声模型

对于均匀量化，量化误差 $\hat{r} - r$ 可以建模为均匀分布的随机噪声，这一模型在信号处理领域广为使用。在深度神经网络中，我们可以扩展这一模型，考虑量化误差在网络中的传播。

假设量化后的参数为 $\hat{\mathbf{W}} = \mathbf{W} + \mathbf{E}_W$ ，量化后的激活值为 $\hat{\mathbf{a}} = \mathbf{a} + \mathbf{E}_a$ ，其中 $\mathbf{E}_W$ 和 $\mathbf{E}_a$ 是量化噪声。对于线性层 $\mathbf{y} = \mathbf{W}\mathbf{x}$ ，量化后的输出为：

$\hat{\mathbf{y}} = \hat{\mathbf{W}}\hat{\mathbf{x}} = (\mathbf{W} + \mathbf{E}_W)(\mathbf{x} + \mathbf{E}_x) = \mathbf{W}\mathbf{x} + \mathbf{W}\mathbf{E}_x + \mathbf{E}_W\mathbf{x} + \mathbf{E}_W\mathbf{E}_x$

假设噪声项相互独立且与信号无关，输出噪声的协方差矩阵可以近似为：

$\text{Cov}(\hat{\mathbf{y}} - \mathbf{y}) \approx \mathbf{W}\text{Cov}(\mathbf{E}_x)\mathbf{W}^T + \text{Cov}(\mathbf{E}_W\mathbf{x})$

其中，

$\text{Cov}(\mathbf{E}_x) = \frac{\Delta_x^2}{12}\mathbf{I}$
$\text{Cov}(\mathbf{E}_W\mathbf{x}) \approx \frac{\Delta_W^2}{12} \cdot \mathbb{E}[\mathbf{x}\mathbf{x}^T]$

这里， $\Delta_x$ 和 $\Delta_W$ 分别是激活值和权重的量化步长。

对于非线性层，如ReLU激活函数 $\sigma(x) = \max(0, x)$ ，量化误差的传播更为复杂，可以通过一阶泰勒展开近似：

$\sigma(\hat{x}) \approx \sigma(x) + \sigma'(x) \cdot (x_q - x) \approx \sigma(x) + \mathbb{I}_{x > 0} \cdot e_x$

其中， $\mathbb{I}_{x > 0}$ 是指示函数，当 $x > 0$ 时为1，否则为0。这表明ReLU激活函数会过滤掉负输入区域的量化噪声，但保留正输入区域的噪声。

对于整个网络，量化误差会从输入到输出累积。假设网络有 $L$ 层，每层的量化误差传播可以递归表示为：

$\mathbf{e}^l = \mathbf{J}^l \mathbf{e}^{l-1} + \mathbf{e}_{\text{quant}}^l$

其中， $\mathbf{e}^l$ 是第 $l$ 层的总误差， $\mathbf{J}^l = \frac{\partial \mathbf{a}^l}{\partial \mathbf{a}^{l-1}}$ 是雅可比矩阵， $\mathbf{e}_{\text{quant}}^l$ 是第 $l$ 层引入的量化误差。

假设各层误差相互独立，则输出的误差协方差矩阵可以近似为：

$\text{Cov}(\mathbf{e}^L) \approx \sum_{l=1}^{L} (\mathbf{J}^L \mathbf{J}^{L-1} \cdots \mathbf{J}^{l+1}) \text{Cov}(\mathbf{e}_{\text{quant}}^l) (\mathbf{J}^L \mathbf{J}^{L-1} \cdots \mathbf{J}^{l+1})^T$

这一表达式表明，早期层的量化误差会通过后续层的雅可比矩阵放大或缩小，因此不同层对量化的敏感度不同。

量化敏感度分析

不同层对量化的敏感度不同，敏感度可以通过扰动分析或Hessian分析来评估。

扰动分析通过直接测量量化对模型输出的影响来评估敏感度：

$S_l = \frac{\|\mathbf{a}^L - \hat{\mathbf{a}}^L\|_2^2}{\|\mathbf{E}_l\|_F^2}$

其中， $\mathbf{a}^L$ 是原始模型的输出， $\hat{\mathbf{a}}^L$ 是在第 $l$ 层引入量化扰动后的输出， $\mathbf{E}_l$ 是第 $l$ 层的量化误差， $\|\cdot\|_F$ 是Frobenius范数。

从优化角度，可以通过Hessian矩阵分析量化敏感度。损失函数关于第 $l$ 层参数的二阶导数可以表示为：

$\mathbf{H}_l = \frac{\partial^2 \mathcal{L}}{\partial \mathbf{W}_l^2}$

量化后的参数 $\hat{\mathbf{W}}_l = \mathbf{W}_l + \mathbf{E}_l$ 引起的损失增加可以通过二阶泰勒展开近似：

$\Delta \mathcal{L} \approx \frac{\partial \mathcal{L}}{\partial \mathbf{W}_l} \cdot \mathbf{E}_l + \frac{1}{2} \mathbf{E}_l^T \mathbf{H}_l \mathbf{E}_l$

对于已经收敛的模型，一阶导数 $\frac{\partial \mathcal{L}}{\partial \mathbf{W}_l}$ 接近于零，主要的损失增加来自二阶项。假设量化误差 $\mathbf{E}_l$ 的每个元素独立同分布，服从均匀分布 $\mathcal{U}(-\frac{\Delta_l}{2}, \frac{\Delta_l}{2})$ ，则预期的损失增加为：

$\mathbb{E}[\Delta \mathcal{L}] \approx \frac{1}{2} \mathbb{E}[\mathbf{E}_l^T \mathbf{H}_l \mathbf{E}_l] = \frac{1}{2} \text{Tr}(\mathbf{H}_l \cdot \mathbb{E}[\mathbf{E}_l \mathbf{E}_l^T]) = \frac{\Delta_l^2}{24} \text{Tr}(\mathbf{H}_l)$

因此，第 $l$ 层的量化敏感度可以定义为 $S_l = \text{Tr}(\mathbf{H}_l)$ 。

由于Hessian矩阵的计算复杂度高，实际应用中通常使用近似方法，如对角Hessian近似：

$S_l \approx \sum_{i,j} \left(\frac{\partial^2 \mathcal{L}}{\partial W_{l,ij}^2}\right)$

或者使用Fisher信息矩阵作为Hessian的近似：

$S_l \approx \mathbb{E}\left[\left(\frac{\partial \mathcal{L}}{\partial \mathbf{W}_l}\right)^T \left(\frac{\partial \mathcal{L}}{\partial \mathbf{W}_l}\right)\right]$

基于敏感度分析，可以为不同层分配不同的量化位宽，以平衡性能和效率。对于敏感度高的层，应分配更高的位宽；对于敏感度低的层，可以使用更低的位宽。

理想的位宽分配策略应满足：

$\frac{S_1 \cdot \Delta_1^2}{C_1} = \frac{S_2 \cdot \Delta_2^2}{C_2} = \ldots = \frac{S_L \cdot \Delta_L^2}{C_L}$

其中， $C_l$ 是第 $l$ 层的计算复杂度， $\Delta_l$ 是第 $l$ 层的量化步长。这一原则表明，每单位计算复杂度的损失增加应在各层之间均衡。

你可能感兴趣的:(dnn,人工智能,算法)

day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
力扣面试题07 - 旋转矩阵茶猫_ leetcode 矩阵算法 c语言
题目：给你一幅由N×N矩阵表示的图像，其中每个像素的大小为4字节。请你设计一种算法，将图像旋转90度。不占用额外内存空间能否做到？示例1:给定matrix=[[1,2,3],[4,5,6],[7,8,9]],原地旋转输入矩阵，使其变为:[[7,4,1],[8,5,2],[9,6,3]]示例2:给定matrix=[[5,1,9,11],[2,4,8,10],[13,3,6,7],[15,14,12,
模拟退火(SA)：如何“故意走错路”，才能找到最优解？小瑞瑞acd 小瑞瑞学数模模拟退火算法 python 启发式算法算法
模拟退火(SA)：如何“故意走错路”，才能找到最优解？图示模拟退火算法如何通过接受较差解（橙色虚线标注）从局部最优（绿色点）逃逸，最终找到全局最优解（紫色点），展示其跳出局部极小值的能力。大家好，我是小瑞瑞！欢迎回到我的专栏！想象一下，你站在一座连绵不绝的山脉中，目标是找到海拔最低的那个山谷。你手上只有一个高度计，视野被浓雾笼罩，只能看清脚下的一小片区域。如果你是一个“贪心”的登山者，你的策略会非
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
量子计算解决气候变化：科学家找到了新方法大力出奇迹985 量子计算
气候变化已成为全球面临的严峻挑战，传统计算方法在应对与之相关的复杂问题时存在诸多局限。而量子计算作为新兴技术，为解决气候变化难题带来曙光。本文深入剖析科学家利用量子计算应对气候变化的新方法。量子计算凭借独特的量子比特与量子特性，在加速气候模型计算、优化模型参数、预测极端天气事件等方面展现出巨大优势。同时，在可再生能源整合、电网管理、碳捕获等实际应用场景中也发挥着重要作用。尽管目前面临硬件和算法等方
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
算法刷题-动态规划之背包问题
1.背包问题之01（4.30）题目描述小明有一个容量为VV的背包。这天他去商场购物，商场一共有NN件物品，第ii件物品的体积为wiwi，价值为vivi。小明想知道在购买的物品总体积不超过VV的情况下所能获得的最大价值为多少，请你帮他算算。输入描述输入第11行包含两个正整数N,VN,V，表示商场物品的数量和小明的背包容量。第2∼N+12∼N+1行包含22个正整数w,vw,v，表示物品的体积和价值。1
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
顺时针旋转N * N 的矩阵忆杰算法 Python 矩阵 python 算法
顺时针旋转题目描述数据范围实现逻辑代码实现题目描述有一个NxN整数矩阵，请编写一个算法，将矩阵顺时针旋转90度。给定一个NxN的矩阵，和矩阵的阶数N,请返回旋转后的NxN矩阵。数据范围0852789963'''#第N列逆序后变成第N行#或者是第i行变成第N-i-1列代码实现classSolution:#列转换为行defline2Row(self,mat,n):arr=[]forlineinrang
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
【经典面试题】【JVM与性能调优】垃圾回收算法（标记-清除算法/复制算法/标记-整理算法/CMS/G1/ZGC）本本本添哥归档 -Inbox1 001 -基础开发能力面试题目汇总 jvm 算法
JVM自动管理内存，当对象不再被引用时，垃圾回收器（GarbageCollector）会自动释放这些对象占用的内存。标记-清除算法（Mark-Sweep）：标记垃圾再清除，会产生碎片。复制算法（Copying）：将存活对象复制到新区域，适合新生代，无碎片但浪费空间。标记-整理算法（Mark-Compact）：标记后将存活对象移到一端，清除另一端，适合老年代。分代收集算法（GenerationalC
从零到一：基于差分隐私决策树的客户购买预测系统实战开发笙囧同学决策树算法机器学习
作者简介：笙囧同学，中科院计算机大模型方向硕士，全栈开发爱好者联系方式：[email protected]各大平台账号：笙囧同学座右铭：偷懒是人生进步的阶梯文章导航快速导航前言-项目背景与价值项目概览-系统架构与功能技术深度解析-核心算法原理️系统实现详解-工程实践细节性能评估与分析-实验结果分析Web系统开发-前后端开发部署与运维-DevOps实践完整复现指南-手把手教程️实践案例与故障排除-问
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu