Paul-Huang

机器学习-白板推导系列(十二)-变分推断（Variational Inference）

12 变分推断（Variational Inference）

12.1 背景介绍

这一小节的主要目的：为什么要使用Variational Inference，Inference到底有什么用。机器学习，我们可以从频率角度和贝叶斯角度两个角度来看，其中频率角度可以被解释为优化问题，贝叶斯角度可以被解释为积分问题。

12.1.1 $频率角度\rightarrow优化问题$

为什么说频率派角度的分析是一个优化问题呢？从回归和SVM两个例子上进行分析。数据集描述为： $\{ (x_i,y_i) \}_{i=1}^N,x_i \in \mathbb{R}^p,y_i \in \mathbb{R}^1$ 。

回归问题
- 回归模型定义： $w^Tx.\tag{12.1.1}$
- 回归模型策略：
  - 其中loss function被定义为：
    $\sum_{i=1}^N || w^Tx_i - y_i ||^2\tag{12.1.2}$
  - 优化可以表达为 $\hat{w} = argmin\ L(w)\tag{12.1.3}$
    这是个无约束优化问题。
- 回归模型求解方法可以分成两种：数值解和解析解。
  - 解析解的解法为：
    $\frac{\partial L(w)}{\partial w} = 0 \Rightarrow w^{\ast} = (X^TX)^{-1}X^TY\tag{12.1.3}$
    其中， $X$ 是一个 $N\times p$ 的矩阵。
  - 数值解常用的是GD算法，也就是 $Gradient\;Descent$ ，或者 $Stochastic\;Gradient\;descent (SGD)$ 。
SVM(分类问题)
- SVM的模型： $sign(w^Tx+b)\tag{12.1.4}$
- SVM的策略：
  loss function为：
  $\left\{ \begin{array}{ll} \min\ \frac{1}{2}w^Tw & \\ s.t. \quad y_i(w^Tx_i + b) \geq 1 & \\ \end{array}\right.\tag{12.1.5}$
  这是一个有约束的Convex优化问题。
- SVM求解方法：
  常用的解决条件为：拉格朗日乘子法、QP方法和Lagrange 对偶。
EM算法
- EM优化目标为：
  $\hat{\theta} = \arg\max\ \log P(x|\theta)\tag{12.1.6}$
- EM优化的迭代算法为：
  $\theta^{(t+1)} = \arg\underset{\theta}{\max}\int_{z} \log P(x,z|\theta)\cdot p(z|x,\theta^{(t)}) dz\tag{12.1.7}$

12.1.2 $贝叶斯角度\rightarrow积分问题$

从贝叶斯的角度来说，这就是一个积分问题，为什么呢？从Bayes公式的表达看：
$P(\theta|x) = \frac{P(x|\theta)P(\theta)}{P(x)}\tag{12.1.8}$

其中， $P(\theta|x)$ 称为后验公式， $P(x|\theta)$ 称为似然函数， $P(\theta)$ 称为先验分布， $P (x)$ 为已知的概率分布，并且 $\int_{\theta}P(x|\theta)P(\theta)d\theta$ 。贝叶斯角度分为 $\color{red}推断(Inference)$ 和 $\color{red}决策$ 。

贝叶斯推断（inference）（求后验 $P(\theta|x)$ ）
什么是推断呢？通俗的说就是求解后验分布 $P(\theta|x)$ ，求解推断可以分为： $\color{red}精确推断$ 和 $\color{red}近似推断$ 。
- 精确推断
  直接求解 $P(\theta|x)$ 。
- 近似推断
  $P(\theta|x)$ 的计算在高维空间的时候非常的复杂，通常不能直接精确的求得，需要采用方法来求一个近似的解。
  - 确定性近似推断
    变分推断(VI)
  - 随机近似推断
    MCMC、MH、Gibbs
贝叶斯决策
数据集 $X$ (N个样本)。我们用数学的语言来表述也就是， $\widetilde{x}$ 为新的样本，求 $p(\widetilde{x}|X)$ ：
$\begin{aligned}{ll}P(\widetilde{x}|X) & = \int_{\theta} P(\widetilde{x},\theta|X) d\theta \\ & = \int_{\theta} P(\widetilde{x}|\theta)\cdot P(\theta|X)d\theta\color{green}{(P(\theta|X)为公式(12.1.8)中的后验)}\\ & = \mathbf{E}_{\theta|X} [P(\hat{x}|\theta)]\end{aligned}\tag{12.1.9}$
本章主讲：
$\color{red}贝叶斯角度\rightarrow贝叶斯推断\rightarrow近似推断\rightarrow确定性近似推断\rightarrow变分推断$

12.2 公式推导

数据
有以下数据：
- $X:observed\;variable\rightarrow X:\left \{x_{i}\right \}_{i=1}^{N}$
- $Z:latent\;variable + parameter\rightarrow Z:\left \{z_{i}\right \}_{i=1}^{N}$
- $(X,Z):complete\;data$
记 $z$ 为隐变量和参数的集合。接着变换概率 $p (x)$ 的形式然后引入分布 $q (z)$ ：
$\color{blue}log\; p(x)=log\; p(x,z)-log\; p(z|x)=log\; \frac{p(x,z)}{q(z)}-log\; \frac{p(z|x)}{q(z)}\tag{12.2.1}$
公式简化
对公式(12.2.1)进行简化，式子两边同时对 $q (z)$ 求积分(期望)：
$左边=\int _{z}q(z)\cdot log\; p(x |\theta )\mathrm{d}z=log\; p(x|\theta )\int _{z}q(z )\mathrm{d}z=log\; p(x|\theta )\tag{12.2.2}$
$右边=\underset{ELBO(evidence\; lower\; bound)}{\underbrace{\int _{z}q(z)log\; \frac{p(x,z|\theta )}{q(z)}\mathrm{d}z}}\underset{KL(q(z)||p(z|x,\theta ))}{\underbrace{-\int _{z}q(z)log\; \frac{p(z|x,\theta )}{q(z)}\mathrm{d}z}}=\underset{变分}{\underbrace{L(q)}} + \underset{\geq 0}{\underbrace{KL(q||p)}}\tag{12.2.3}$
Evidence Lower Bound (ELBO)是变分， $L (q)$ 和 $K L (q ∣ ∣ p)$ 被记为：
$\color{blue}\{ \begin{array}{ll}L(q)&=\int_z q(z)\log\ \frac{p(x,z|\theta)}{q(z)}dz\\ KL(q||p)&= - \int_z q(z)\log\ \frac{p(z|x)}{q(z)}dz \end{array}$
$p (x)$ 是个定值，我们的目的是寻找一个使得 $q (z)$ 与 $p(z|x,\theta)$ 更接近，也就是使 $K L (q ∣ ∣ p)$ 越小越好，也就是要使 $L (q)$ 越大越好：
$\color{blue}\tilde{q}(z)=\arg\underset{q(z)}{\max}\; L(q)\Rightarrow \tilde{q}(z)\approx p(z|x)\tag{12.2.4}$
- $\color{red}L(q)$ 并非普通的函数，而是以函数 $q$ 为自变量的函数，这就是 $\color{red}泛函$ 。泛函可以看成是函数概念的推广，而变分方法是处理泛函的数学领域，和处理函数的普通微积分相对。
- $\color{red}变分法最终寻求的是极值函数：它们使得泛函取得极大或极小值。$
模型求解

平均场理论：把多维变量的不同维度分为 $M$ 组，组与组之间是相互独立的：
$\color{red}q(z)=\prod_{i=1}^{M}q_{i}(z_{i})\tag{12.2.5}$

在这种分解的思想中，我们每次只考虑第 $\color{blue}j$ 个分布，那么令 $\color{blue}q_i(1,2,\cdots,j-1,j+1,\cdots,M)$ 个分布 $\color{blue}fixed$ 。将 $L (q)$ 写作两部分：
$L(q)=\underset{①}{\underbrace{\int _{z}q(z)log\; p(x,z)\mathrm{d}z}}-\underset{②}{\underbrace{\int _{z}q(z)log\; q(z)\mathrm{d}z}}\tag{12.2.6}$
- 对于①：
  $\begin{aligned}①&=\int _{z}q(z)log\; p(x,z)\mathrm{d}z\\ &=\int _{z}\prod_{i=1}^{M}q_{i}(z_{i})log\; p(x,z)\mathrm{d}z_{1}\mathrm{d}z_{2}\cdots \mathrm{d}z_{M}\\ &=\int _{z_{j}}q_{j}(z_{j})\underset{\int _{z-z_{j}}log\; p(x,z)\prod_{i\neq j}^{M}q_{i}(z_{i})\mathrm{d}z_{i}}{\underbrace{\left (\int_{z_1}\int_{z_2}\cdots\int_{z_M}\prod_{i\neq j}^{M}q_{i}(z_{i})log\; p(x,z)\underset{(i\neq j)}{\mathrm{d}z_{1}\mathrm{d}z_{2}\cdots \mathrm{d}z_{M}}\right )}}\mathrm{d}z_{j}\\ &=\int _{z_{j}}q_{j}(z_{j})\cdot E_{\prod_{i\neq j}^{M}q_{i}(z_{i})}[log\; p(x,z)]\cdot \mathrm{d}z_{j}\end{aligned}\tag{12.2.7}$
  因为我们仅仅只关注第 $j$ 项，其他的项都不关注。为了进一步表达计算，我们将：
  $\mathbf{E}_{\prod_{i \neq j}^Mq_i(z_i)}\left[ \log p(x,z) \right] = \log \hat{p}(x,z_j)\tag{12.2.8}$
  那么(12.2.7)式可以写作：
  $\color{red}\begin{aligned}①&=\int _{z}q(z)log\; p(x,z)\mathrm{d}z\\ & = \int_{z_j}q_j(z_j) \log \hat{p}(x,z_j) dz_j\end{aligned}\tag{12.2.9}$
  这里的 $\hat{p}(x,z_j)$ 表示为一个相关的函数形式，假设具体参数未知。
- 对于②：
  $\begin{aligned}②&=\int _{z}q(z)log\; q(z)\mathrm{d}z\\ &=\int _{z}\prod_{i=1}^{M}q_{i}(z_{i})\sum_{i=1}^{M}log\; q_{i}(z_{i})\mathrm{d}z\\ &=\int _{z}\prod_{i=1}^{M}q_{i}(z_{i})[log\; q_{1}(z_{1})+log\; q_{2}(z_{2})+\cdots +log\; q_{M}(z_{M})]\mathrm{d}z\end{aligned}\tag{12.2.10}$
  对其中第一项进行处理：
  $\begin{aligned} &\int _{z}\prod_{i=1}^{M}q_{i}(z_{i})log\; q_{1}(z_{1})\mathrm{d}z\\ & =\int _{z_{1}z_{2}\cdots z_{M}}q_{1}(z_{1})q_{2}(z_{2})\cdots q_{M}(z_{M})\cdot log\; q_{1}(z_{1})\mathrm{d}z_{1}\mathrm{d}z_{2}\cdots \mathrm{d}z_{M}\\ &=\int _{z_{1}}q_{1}(z_{1})log\; q_{1}(z_{1})\mathrm{d}z_{1}\cdot \underset{=1}{\underbrace{\int _{z_{2}}q_{2}(z_{2})\mathrm{d}z_{2}}}\cdot \underset{=1}{\underbrace{\int _{z_{3}}q_{3}(z_{3})\mathrm{d}z_{3}}}\cdots \underset{=1}{\underbrace{\int _{z_{M}}q_{M}(z_{M})\mathrm{d}z_{M}}}\\ &=\int _{z_{1}}q_{1}(z_{1})log\; q_{1}(z_{1})\mathrm{d}z_{1}\end{aligned}\tag{12.2.11}$
  也就是说：
  $\int _{z}\prod_{i=1}^{M}q_{i}(z_{i})log\; q_{k}(z_{k})\mathrm{d}z=\int _{z_{k}}q_{k}(z_{k})log\; q_{k}(z_{k})\mathrm{d}z_{k}\tag{12.2.12}$
  则：
  $\color{red}\begin{aligned}②&=\int _{z}q(z)log\; q(z)\mathrm{d}z\\&=\sum_{i=1}^{M}\int _{z_{i}}q_{i}(z_{i})log\; q_{i}(z_{i})\mathrm{d}z_{i}\\ &=\int _{z_{j}}q_{j}(z_{j})log\; q_{j}(z_{j})\mathrm{d}z_{j}+C\end{aligned}\tag{12.2.13}$
- $L (q)$ 可以写成：
  $\begin{aligned}L(q)&=\underset{①}{\underbrace{\int _{z}q(z)log\; p(x,z)\mathrm{d}z}}-\underset{②}{\underbrace{\int _{z}q(z)log\; q(z)\mathrm{d}z}}\\ &= \int_{z_j}q_j(z_j) \log \hat{p}(x,z_j) dz_j - \int _{z_{j}}q_{j}(z_{j})log\; q_{j}(z_{j})\mathrm{d}z_{j}+C\\ &=-KL(q_j || \hat{p}(x,z_j)) +C \end{aligned}\tag{12.2.14}$
  其中 $-KL(q_j || \hat{p}(x,z_j)) \leq 0$ ，根据公式(12.2.4)可得：
  $\color{red}\begin{aligned}\tilde{q}(z)&=\arg\underset{q(z)}{\max}\; L(q)\\ & = \arg\underset{q_j(z_j)}{\max}\; -KL(q_j || \hat{p}(x,z_j))\\ & = \arg\underset{q_j(z_j)}{\min}\;KL(q_j || \hat{p}(x,z_j))\end{aligned}\tag{12.2.15}$
  当 $\color{red}\log \hat{p}(x,z_j)=\mathbf{E}_{\prod_{i \neq j}^Mq_i(z_i)}\left[ \log p(x,z) \right]取最小值$ ：
  $\color{red}\log q_j(z_j) = \mathbf{E}_{\prod_{i \neq j}q_i(z_i)}\left[ \log p(x,z|\theta) \right] + C\tag{12.2.16}$
  - $\color{blue}公式(12.2.16)就是VI算法的基本思路$ 。但是现实生活中 $z$ 很难求解，因此需要用平均场理论进行一下化简。
  - 下一节将回归EM算法，并给出求解的过程。

12.3 再回首

Variational Inference(VI)的核心思想是在于用一个分布 $q (z)$ 来近似得到 $p (z ∣ x)$ 。其中优化目标为：
$\hat{q} = argmin\ KL(q||p)$
在这个求解中，主要想求的是 $q (z)$ ，那么需要弱化 $\theta$ 的作用。所以，计算的目标函数为：
$\color{blue}\hat{q} = \arg\min_{q} KL(q||p) = \arg\max_q \mathcal{L}(q)\tag{12.3.1}$
所以本节对上一节的一些地方进行解释、对EM算法的符号进行规范化处理，以及对迭代方法进行求解。

平均场理论解释
平均场理论：把多维变量的不同维度分为 $M$ 组，组与组之间是相互独立的：
$\color{red}q(z)=\prod_{i=1}^{M}q_{i}(z_{i})\tag{12.3.2}$
注： ${\color{red} z_i表示的不是一个数，而是一个数据维度的集合，}$ ${\color{red} 它表示的不是一个维度，而是一个类似的最大团，也就是多个维度凑在一起。}$
数学符号规范化（仔细与上一节进行对比）
1. 数据
  有以下数据：
  - $X:observed\;variable\rightarrow X:\left \{x^{(i)}\right \}_{i=1}^{N}$
  - $Z:latent\;variable + parameter\rightarrow Z:\left \{z^{(i)}\right \}_{i=1}^{N}$
  - $(X,Z):complete\;data$
2. ELBO和KL
  在这里我们弱化了相关参数 $\theta$ ，也就是求解过程中，不太考虑 $\theta$ 起到的作用。展示一下似然函数:
  $\log p_{\theta}(X) = \log \prod_{i=1}^N p_{\theta}(x^{(i)}) = \sum_{i=1}^N \log p_{\theta}(x^{(i)})\tag{12.3.3}$
  目标是使每一个 $x^{(i)}$ 最大，所以将对ELBO和 $K L (p ∣ ∣ q)$ 进行规范化表达：
  - $\color{blue}ELBO$ (第十讲：公式(10.5.6))：
    $\mathbf{E}_{q(z)}\left[ \log \frac{p_{\theta}(x^{(i)},z)}{q(z)} \right] = \mathbf{E}_{q(z)}\left[ \log p_{\theta}(x^{(i)},z) \right]+ H(q(z))\tag{12.3.4}$
  - $\color{blue}KL$ (第十讲：公式(10.5.2)):
    $\int q(z)\cdot \log \frac{q(z)}{p_{\theta}(z|x^{(i)})} dz\tag{12.3.5}$
  - $\color{blue}\log\;q_j(z_j)$ (本节：公式(12.2.16))
    $\begin{aligned} & \log q_j(z_j)\\ & = \mathbf{E}_{\prod_{i \neq j} q_i(z_i)}\left[ \log p_{\theta} (x^{(i)},z) \right] + C \\ & = \int_{q_1} \int_{q_2} \cdots \int_{q_{j-1}}\int_{q_{j+1}} \cdots \int_{q_{M}} q_1q_2\cdots q_{j-1}q_{j+1} \cdots q_M \log p_{\theta} (x^{(i)},z)dq_1dq_2 \cdots dq_{j-1}dq_{j+1} \cdots dq_{M} \\ \end{aligned}\tag{12.3.6}$
VI算法的具体求解
根据 $公式 (12.2.16)$ 使用迭代算法来进行求解：
$\color{red}\begin{array}{ll} \hat{q}_1(z_1) = \int_{q_2} \cdots \int_{q_{M}} q_2 \cdots q_M \left[ \log p_{\theta}(x^{(i)},z) \right]dq_2 \cdots dq_{M} \\ \hat{q}_2(z_2) = \int_{\hat{q}_1(z_1)}\int_{q_3} \cdots \int_{q_{M}} \hat{q}_1q_3 \cdots q_M \left[ \log p_{\theta}(x^{(i)},z) \right]\hat{q}_1dq_2 \cdots dq_{M} \\ \vdots \\ \hat{q}_M(z_M) = \int_{\hat{q}_1} \cdots \int_{\hat{q}_{M-1}} \hat{q}_1 \cdots \hat{q}_{M-1} \left[ \log p_{\theta}(x^{(i)},z) \right]d\hat{q}_1 \cdots d\hat{q}_{M-1}\end{array}\tag{12.3.7}$
如果将 ${q}_1,{q}_2,\cdots,{q}_M$ 看成一个个的坐标点，那么随着计算的深入，知道的坐标点越来越多，这实际上就是一种坐标上升的方法(Coordinate Ascend)。

这是一种迭代算法，那怎么考虑迭代的停止条件呢？设置当 $\color{blue}\mathcal{L}^{(t+1)} \leq \mathcal{L}^{(t)}$ 时停止迭代。
VI算法的整体步骤
针对平均场变分分布， $\color{green}坐标上升近似推断算法（CAVI）$ 是最常见的优化方法。CAVI交替地更新每个隐变量，更新时固定其他的隐变量的变分分布参数，用来计算当前隐变量 $z_j$ 的坐标上升公式。CAVI的算法步骤如下图所示。

用一张图来表示 $q$ 分布的变化。
Mean Field Theory(平均场理论)的存在问题
- $\color{red}假设太强$
  首先这个假设太强了。在假设中，假设变分后验分式是一种完全可分解的分布。实际上，这样的适用条件挺少的。大部分时候都并不会适用。
- $\color{red}Intractable$
  本来就是因为后验分布 $p (Z ∣ X)$ 的计算非常的复杂，所以才使用变分推断来进行计算。但这个迭代的方法也非常的难以计算，
  $\log q_j(z_j) = \mathbf{E}_{\prod_{i \neq j}q_i(z_i)}\left[ \log p(X,Z|\theta) \right] + C\tag{12.3.8}$
  并且公式(12.3.8)的计算也非常的复杂。所以需要寻找一种更加优秀的方法，比如Stein Disparency等等。Stein变分是个非常Fashion的东西，机器学习理论中非常强大的算法，以后会详细的分析。

12.4 随机梯度变分推断-SGVI-1

在上一小节分析了 $\color{green}Mean\;Field\;Theory\;Variational\;Inference$ (平均场论变分推断)，通过平均假设来得到变分推断的理论，是一种 $Classical\;VI$ ，可以将其看成 $\color{green}Coordinate\;Ascend$ (坐标上升)。
本节为了克服Mean Field Theory的存在问题，介绍另一种方法是 $\color{green}Stochastic\;Gradient\;Variational\;Inference$ (SGVI，随机梯度变分推断)。
对于隐变量参数 $z$ 和数据集 $x$ 。
- $\color{red}z \longrightarrow x$ 是Generative Model，也就是 $p (x ∣ z)$ 和 $p (x, z)$ ，这个过程也被我们称为 $\color{red}Decoder$ 。
- $\color{red}x \longrightarrow z$ 是Inference Model，表达关系是 $p (z ∣ x)$ ，这个过程被我们称为 $\color{red}Encoder$ 。

本节先对SGVI参数规范，然后SGVI的梯度推导。

SGVI参数规范
本节的 $\color{green}Stochastic\;Gradient\;Variational\;Inference (SGVI)$ 方法的基本思路（此处参数更新和平均场论变分推理方法的参数的更新方法类似）为：
$\color{red}\phi^{(t+1)} \longrightarrow \phi^{(t)} + \lambda^{(t)}\nabla {L}(q)\tag{12.4.1}$
其中， $q (z ∣ x)$ 简化表示为 $q (z)$ ；令 $q (z)$ 是一个固定形式的概率分布， $\phi$ 为这个分布的参数，那么这个概率可写成 $\color{blue}q_{\phi}(z)$ 。 $\color{blue}目标就是求解\nabla {L}(q)(\nabla_{\phi}{L}(\phi))$ 。
- 那么ELBO( $\color{blue}L(q)=\int_z q(z)\log\ \frac{p(x,z|\theta)}{q(z)}dz$ )被记为：
  $\color{red}ELBO = {L}(\phi)= \mathbf{E}_{q_{\phi}(z)}\left[ \log p_{\theta}(x^{(i)},z) - \log q_{\phi}(z) \right]\tag{12.4.2}$
- $log\;p(x)$ （ $log\; p(x)=ELBO+KL(q||p)$ ）可以写为：
  $\log p_{\theta}(x^{(i)}) = ELBO + KL(q||p) \geq {L}(\phi)\tag{12.4.3}$
  因此求解目标转换成：
  $\hat{p} = \arg\max_{\phi} {L}(\phi)\tag{12.4.4}$
SGVI的梯度推导
1. 根据公式(12.4.1)和公式(12.4.2)得：
  $\color{blue}\begin{aligned}\nabla_{\phi }L(\phi )& =\nabla_{\phi }E_{q_{\phi }}[log\; p_{\theta }(x,z)-log\; q_{\phi }(z)]\\ &=\nabla_{\phi }\int q_{\phi }(z)[log\; p_{\theta }(x,z)-log\; q_{\phi }(z)]\mathrm{d}z\\ &=\underset{①}{\underbrace{\int \nabla_{\phi }q_{\phi }(z)\cdot [log\; p_{\theta }(x,z)-log\; q_{\phi }(z)]\mathrm{d}z}}+\underset{②}{\underbrace{\int q_{\phi }(z)\nabla_{\phi }[log\; p_{\theta }(x,z)-log\; q_{\phi }(z)]\mathrm{d}z}}\end{aligned}\tag{12.4.5}$
2. 在对其中①和②单独计算：
  $\begin{aligned}②&=\int q_{\phi }(z)\nabla_{\phi }[\underset{与\phi 无关}{\underbrace{log\; p_{\theta }(x,z)}}-log\; q_{\phi }(z)]\mathrm{d}z\\ &=-\int q_{\phi }(z)\nabla_{\phi }log\; q_{\phi }(z)\mathrm{d}z\\ &=-\int q_{\phi }(z)\frac{1}{q_{\phi }(z)}\nabla_{\phi }q_{\phi }(z)\mathrm{d}z\\ & =-\int \nabla_{\phi }q_{\phi }(z)\mathrm{d}z\\ &=-\nabla_{\phi }\int q_{\phi }(z)\mathrm{d}z\\ &=-\nabla_{\phi }1=0\end{aligned}\tag{12.4.6}$
  因此公式(12.4.5)可以简化为：
  $\begin{aligned}\nabla_{\phi }L(\phi )=① &=\int {\color{Red}{\nabla_{\phi }q_{\phi }(z)}}\cdot [log\; p_{\theta }(x,z)-log\; q_{\phi }(z)]\mathrm{d}z\\ &=\int {\color{Red}{q_{\phi }(z)\nabla_{\phi }log\; q_{\phi }(z)}}\cdot [log\; p_{\theta }(x,z)-log\; q_{\phi }(z)]\mathrm{d}z\\ &=E_{q_{\phi }}[(\nabla_{\phi }log\; q_{\phi }(z))(log\; p_{\theta }(x,z)-log\; q_{\phi }(z))]\end{aligned}\tag{12.4.7}$
  其中红色部分是根据公式(12.4.6)的第二行到第四行得到的。因此：
  $\color{red}\nabla_{\phi} {L}(\phi) = \mathbf{E}_{q_{\phi}} \left[ \nabla_{\phi}\log q_{\phi} (\log p_{\theta}(x^{(i)},z) - \log q_{\phi}) \right]\tag{12.4.8}$
  那么如何求这个期望呢？采用的是蒙特卡罗采样法，假设 $z^l \sim q_{\phi} (z)\ l = 1, 2, \cdots, L$ ，那么有：
  $\color{blue}\nabla_{\phi} {L}(\phi) \approx \frac{1}{L} \sum_{l=1}^L \nabla_{\phi}\log q_{\phi}(z^{(l)})\left[ \log p_{\theta}(x^{(i)},z) - \log q_{\phi}(z^{(l)})\right]\tag{12.4.9}$

12.5 随机梯度变分推断-SGVI-2

本节继上一节的内容，介绍Variance Reduction(方差缩减) 。

存在问题
上节最后的公式(12.4.8)：
$\nabla_{\phi} {L}(\phi) = \mathbf{E}_{q_{\phi}} \left[ {\color{red}\nabla_{\phi}\log q_{\phi}}( \log p_{\theta}(x^{(i)},z) - \log q_{\phi}) \right]$
这样的求法存在问题？
- 一方面在采样的过程中，可能采到 $\color{red}q_{\phi}(z) \longrightarrow 0$ 的点，对于log函数来说， $\color{red}\underset{x\longrightarrow 0}{\lim}log\;x = \infty$ ，那么梯度的变化会非常的剧烈，非常的不稳定。就会出现 $High\;Variance$ 的问题，没有办法求解。
- 另一方面 $\color{red}\hat{\phi} \longrightarrow q(z)$ 也有误差，此误差和梯度剧烈变化带来的误差，误差叠加，这算法根本没有办法用。
解决方法
- 整体思路：利用一个确定的解 $\color{red}p(\epsilon)$ ，简化计算。因为 $z$ 来自于 $q_{\phi}(z|x)$ ，将 $z$ 中的随机变量给解放出来。
- 改写方法
  即：使用 $\color{red}转换z = g_{\phi}(\epsilon, x^{(i)})$ ，其中 $\epsilon \sim p(\epsilon)$ 。这样做有什么好处呢？
  - 原来的 $\nabla_{\phi} \mathbf{E}_{q_{\phi}}[\cdot]$ 将转换为 $\mathbf{E}_{p(\epsilon)}[\nabla_{\phi}(\cdot)]$ ， $\color{blue}方差$ 不再是连续的关于 $\phi$ 的采样，可以有效的降低方差。
  - 并且， $z$ 是一个关于 ${\epsilon}$ 的函数，我们将随机性转移到了 ${\epsilon}$ ，那么问题就可以简化为：
    $\color{red}z \sim q_{\phi}(z|x^{(i)}) \longrightarrow \epsilon \sim p(\epsilon)\tag{12.5.1}$
  - 因为 $\int q_{\phi}(z|x^{(i)})dz = \int p(\epsilon)d\epsilon = 1$ ，则 $q_{\phi}(z|x^{(i)})$ 和 $p(\epsilon)$ 之间存在一个变换关系，即：
    $\color{red}|q_{\phi}(z|x^{(i)})dz| = |p(\epsilon)d\epsilon|\tag{12.5.2}$
- 改写 $\nabla_{\phi} \mathcal{L}(\phi)$
  改写 $\nabla_{\phi} \mathcal{L}(\phi)$ ：

day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
力扣面试题07 - 旋转矩阵茶猫_ leetcode 矩阵算法 c语言
题目：给你一幅由N×N矩阵表示的图像，其中每个像素的大小为4字节。请你设计一种算法，将图像旋转90度。不占用额外内存空间能否做到？示例1:给定matrix=[[1,2,3],[4,5,6],[7,8,9]],原地旋转输入矩阵，使其变为:[[7,4,1],[8,5,2],[9,6,3]]示例2:给定matrix=[[5,1,9,11],[2,4,8,10],[13,3,6,7],[15,14,12,
模拟退火(SA)：如何“故意走错路”，才能找到最优解？小瑞瑞acd 小瑞瑞学数模模拟退火算法 python 启发式算法算法
模拟退火(SA)：如何“故意走错路”，才能找到最优解？图示模拟退火算法如何通过接受较差解（橙色虚线标注）从局部最优（绿色点）逃逸，最终找到全局最优解（紫色点），展示其跳出局部极小值的能力。大家好，我是小瑞瑞！欢迎回到我的专栏！想象一下，你站在一座连绵不绝的山脉中，目标是找到海拔最低的那个山谷。你手上只有一个高度计，视野被浓雾笼罩，只能看清脚下的一小片区域。如果你是一个“贪心”的登山者，你的策略会非
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
量子计算解决气候变化：科学家找到了新方法大力出奇迹985 量子计算
气候变化已成为全球面临的严峻挑战，传统计算方法在应对与之相关的复杂问题时存在诸多局限。而量子计算作为新兴技术，为解决气候变化难题带来曙光。本文深入剖析科学家利用量子计算应对气候变化的新方法。量子计算凭借独特的量子比特与量子特性，在加速气候模型计算、优化模型参数、预测极端天气事件等方面展现出巨大优势。同时，在可再生能源整合、电网管理、碳捕获等实际应用场景中也发挥着重要作用。尽管目前面临硬件和算法等方
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
数据中台中的数据科学工作台：Jupyter集成方案 AI大数据智能洞察大数据与AI人工智能 jupyter 信息可视化 ide ai
数据中台中的数据科学工作台：Jupyter集成方案关键词：数据中台、数据科学工作台、JupyterNotebook、数据科学、机器学习、数据可视化、协作开发摘要：本文深入探讨了在数据中台架构中集成JupyterNotebook作为数据科学工作台的完整解决方案。我们将从数据中台的基本概念出发，详细分析Jupyter在数据科学工作流中的核心作用，介绍多种集成方案和技术实现细节，并通过实际案例展示如何构
算法刷题-动态规划之背包问题
1.背包问题之01（4.30）题目描述小明有一个容量为VV的背包。这天他去商场购物，商场一共有NN件物品，第ii件物品的体积为wiwi，价值为vivi。小明想知道在购买的物品总体积不超过VV的情况下所能获得的最大价值为多少，请你帮他算算。输入描述输入第11行包含两个正整数N,VN,V，表示商场物品的数量和小明的背包容量。第2∼N+12∼N+1行包含22个正整数w,vw,v，表示物品的体积和价值。1
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
顺时针旋转N * N 的矩阵忆杰算法 Python 矩阵 python 算法
顺时针旋转题目描述数据范围实现逻辑代码实现题目描述有一个NxN整数矩阵，请编写一个算法，将矩阵顺时针旋转90度。给定一个NxN的矩阵，和矩阵的阶数N,请返回旋转后的NxN矩阵。数据范围0852789963'''#第N列逆序后变成第N行#或者是第i行变成第N-i-1列代码实现classSolution:#列转换为行defline2Row(self,mat,n):arr=[]forlineinrang
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
【经典面试题】【JVM与性能调优】垃圾回收算法（标记-清除算法/复制算法/标记-整理算法/CMS/G1/ZGC）本本本添哥归档 -Inbox1 001 -基础开发能力面试题目汇总 jvm 算法
JVM自动管理内存，当对象不再被引用时，垃圾回收器（GarbageCollector）会自动释放这些对象占用的内存。标记-清除算法（Mark-Sweep）：标记垃圾再清除，会产生碎片。复制算法（Copying）：将存活对象复制到新区域，适合新生代，无碎片但浪费空间。标记-整理算法（Mark-Compact）：标记后将存活对象移到一端，清除另一端，适合老年代。分代收集算法（GenerationalC
从零到一：基于差分隐私决策树的客户购买预测系统实战开发笙囧同学决策树算法机器学习
作者简介：笙囧同学，中科院计算机大模型方向硕士，全栈开发爱好者联系方式：[email protected]各大平台账号：笙囧同学座右铭：偷懒是人生进步的阶梯文章导航快速导航前言-项目背景与价值项目概览-系统架构与功能技术深度解析-核心算法原理️系统实现详解-工程实践细节性能评估与分析-实验结果分析Web系统开发-前后端开发部署与运维-DevOps实践完整复现指南-手把手教程️实践案例与故障排除-问
基于随机森林的白酒风味智能分类系统：从数据到洞察的完整实践笙囧同学 python
作者：笙囧同学|中科院计算机大模型方向硕士|全栈开发爱好者座右铭：偷懒是人生进步的阶梯联系方式：[email protected]各大平台账号/公众号：笙囧同学前言大家好，我是笙囧同学！今天给大家分享一个超级有趣且技术含量爆表的项目——白酒风味智能分类系统。作为一个既爱技术又爱美酒的程序员，我花了大量时间研究如何用机器学习的方法来"品酒"，让AI帮我们识别白酒的风味特征。这个项目融合了机器学习、数
CMS垃圾回收器+G1垃圾回收器+ZGC垃圾回收器详解及对比 weixin_43751710 jvm java 算法
一、CMS收集器CMS(ConcurrentMarkSweep)收集器是一种以获取最短回收停顿时间为目标的收集器，是一款针对老年代的垃圾回收器，一般和Parallel回收器（一款新生代回收器，是使用复制算法的收集器，又是并行的多线程收集器，收集时会Stoptheworld）配合使用。1.工作过程从名字（包含“MarkSweep”）上就可以看出CMS收集器是基于标记-清除算法实现的，它的运作整个过程
负载均衡-加权随机算法 BP白朴 Nginx 负载均衡 java 算法服务器
负载均衡-加权随机算法由于访问概率大致相同，所以如果部分服务器性能不一致的话，容易导致性能差的服务器压力过大，所以要根据服务器性能不一致的情况，给性能好的服务器多处理请求，给差的少分配请求（能者多劳）所以就需要在随机算法的基础上给每台服务器设置权重，延伸为加权随机算法1、将应用服务器集群的IP存到Map里,每个IP对应有一个权重2、创建一个List,来将所有权重下的IP存到list里面如：192.
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号