写进メ诗的结尾。

SVM —— 理论推导

SVM

支持向量
- 线性可分
- 最大间隔超平面
- 最大间隔超平面的推导
- 支持向量
- 分类间隔的推导
- 最优化问题
对偶问题
- 拉格朗日乘子法
- 强对偶性
SVM 优化
软间隔
- 解决问题
- 优化目标及求解
核函数
- 线性不可分
- 核函数的作用
- 常见核函数
SVM 算法优缺点

支持向量机（Support Vector Machine，SVM）是一种常用的监督学习算法，主要用于分类和回归任务。它的核心思想是找到一个最优的超平面或者曲面，将不同类别的样本点分开。

在二分类问题中，SVM 试图找到一个超平面来将两个类别的样本点分隔开，并使得两个类别距离超平面的最小间隔最大化。这个超平面被称为最大间隔超平面。对于非线性可分的情况，SVM 可以通过使用核函数将输入空间映射到高维特征空间，从而使数据在新的特征空间中线性可分。

训练 SVM 模型的过程包括以下步骤：

收集和准备训练数据集，确保数据集中的标签已知。
选择合适的核函数，并确定相应的参数。
构建目标函数，即最大化间隔的优化问题。
使用优化算法求解目标函数，找到最优的超平面或者曲面。
根据训练好的模型进行预测和分类。

支持向量

线性可分

通俗的讲：在二维空间中，如果两类点能够被一条直线完全分开，那么这两类点就是线性可分的。

严格的讲： $D_0$ 和 $D_1$ 是 $n$ 维欧式空间中的两个点集，如果存在 $n$ 维向量 $w$ 和实数 $b$ ，使得所有属于 $D_0$ 点 $x_i$ 都有 $wx_i + b > 0$ ，而所有属于 $D_1$ 的点 $x_j$ 都有 $wx_j + b < 0$ ，则称 $D_0$ 和 $D_1$ 线性可分。

我们从线性可分的二分类问题入手，如下图所示：

上述图中，红点和蓝点分别表示两个不同的类别，数据显然是线性可分的，但是能够将两类数据分开的直线也显然不止一条。中间那条黑色实线为分界线，我们称之为决策面，一个决策面对应一个线性分类器。从分类结果上看，分类器 A 和分类器 B 的分类效果是相同的，都能把两个类别完全分开。

实际上，分类器 A 和分类器 B 的分类性能是有差距的，如下图所示：

在决策面不变的情况下，添加了一个红点数据。可以看到，分类器 A 依然能够很好的对其进行分类，而分类器 B 则出现了分类错误，显然分类器 A 的决策面更加稳健。

最大间隔超平面

在决策面不变且不会错分样本的情况下，移动决策面，可以在原决策面两侧分别找到一个极限位置，越过该位置就会导致错分，如上图中的虚线所示。虚线的位置由距离原决策面最近的样本点决定，两条虚线之间的垂直距离就是决策面的分类间隔。

显然，每一个能把两类数据正确分开的方向都有一个最优决策面，这些最优决策面都有各自的分类间隔，其中具有最大间隔的决策面就是 SVM 算法要寻找的最优解。最优解对应的两条虚线穿过的样本点，就是 SVM 中的支持样本点，称之为支持向量。

从二维扩展到多维空间时，能将 $D_0$ 和 $D_1$ 完全分开的 $w x + b = 0$ 就成了一个超平面。为了使这个超平面更具鲁棒性，我们会寻找出一个最佳超平面（即以最大间隔把两类样本分开的超平面），也称之为最大间隔超平面。

最大间隔超平面的推导

我们知道二维空间中的直线方程可写成如下：
$y = a x + b$
我们做个小改动，将 $x$ 轴变成 $x_1$ ，将 $y$ 轴变成 $x_2$ ，则有：
$x_2 = ax_1 + b \implies ax_1 - x_2 + b = 0$
将上述公式向量化，得：
$\begin{bmatrix}a & -1\end{bmatrix}\begin{bmatrix}x_1 \\ x_2\end{bmatrix}+ b = 0 \implies w^Tx + b = 0$
将上述公式从二维空间推广到 $n$ 维空间，就变成了超平面方程（一个超平面在二维空间中的实例就是一条直线）。

因此，超平面可以用下式表示：
$w^Tx + b = 0$
其中， $w=[w_1, w_2, ..., w_n]^T$ ， $x=[x_1, x_2, ..., x_n]^T$ 。

支持向量

距离超平面最近的样本点，就叫做支持向量。

分类间隔的推导

在二维空间中，点 $(x, y)$ 到直线 $A x + B y + C = 0$ 的距离公式可以写成如下：
$\frac{|Ax+By+C|}{\sqrt {A^2 + B^2}}$
将直线方程扩展到 $n$ 维空间，点 $x=(x_1, x_2, ..., x_n)$ 到超平面 $w^Tx + b = 0$ 的距离公式可以写成如下：
$\frac{|w^Tx + b|}{||w||}$
其中， $||w||=\sqrt {w_1^2 + w_2^2 + ··· + w_n^2}$ 。

上式中的 $d$ 就是分类间隔，分类间隔越大，我们就认为这个超平面的分类效果越好。此时，求解超平面的问题就转化成了求解分类间隔最大化的问题。

最优化问题

求解最佳超平面（最大间隔超平面）的过程，就叫做最优化。一个最优化问题通常考虑两个基本要素，目标函数与优化对象。在求解最佳超平面的过程中，分类间隔就是目标函数，超平面就是优化对象。我们需要对分类间隔与超平面进行数学建模。

超平面方程在上文中已推导得出，即为 $w^Tx + b = 0$ 。其中 $w$ 是超平面的法向量， $b$ 是截距。假设有一个超平面能够将正例和负例完全分开，正例的标签为 1，负例的标签为 -1，那么我们的目标就是要找到最优的 $w$ 和 $b$ ，使得所有正例点满足 $w^Tx + b >= 1$ ，所有负例点满足 $w^Tx + b <= -1$ ，并且最大化间隔（即正例点和负例点到超平面的距离之和）。

分类间隔方程在上文中也已推导得出，即为 $\frac{|w^Tx + b|}{||w||}$ ，这个就是目标函数。根据支持向量的定义我们知道，支持向量到超平面的距离为 $d$ ，其他样本点到超平面的距离大于 $d$ 。

于是，我们可以得出：
$\left\{\begin{matrix}\frac{w^Tx + b}{||w||} \ge d & y = 1 \\ \frac{w^Tx + b}{||w||} \leq -d & y = -1\end{matrix}\right.$
两边同时除以 $d$ ，得到：
$\left\{\begin{matrix}\frac{w^Tx + b}{||w||d} \ge 1 & y = 1 \\ \frac{w^Tx + b}{||w||d} \leq -1 & y = -1\end{matrix}\right.$
由于 $∣∣ w ∣∣$ 和 $d$ 都是标量，都为正数，因此我们可以令 $∣∣ w ∣∣ d$ 为 $1$ （之所以令它为 $1$ ，是为了方便后续的推导和优化，且这个做法对目标函数的优化并无影响），得到：
$\left\{\begin{matrix}w^Tx + b \ge 1 & y = 1 \\ w^Tx + b \leq -1 & y = -1\end{matrix}\right.$
将两个方程合并（两边同乘以 $y$ ），得到：
$y(w^Tx + b) \ge 1$
至此，我们可以得到超平面两侧的经过支持向量且与超平面平行的平面方程，如下图所示：

每个支持向量到超平面的距离可以写成如下：
$\frac{|w^Tx + b|}{||w||}$
由上述 $y(w^Tx + b) \ge 1 > 0$ ，可以得到 $y(w^Tx + b) = |w^Tx + b|$ ， $\pm 1$ ，进而得到：
$\frac{y(w^Tx + b)}{||w||}$
我们可以最大化这个距离：
$\ 2*\frac{y(w^Tx + b)}{||w||}$
这里乘上 $2$ 是为了方便后续的推导，对目标函数没有影响。支持向量样本点有 $y(w^Tx + b) = |w^Tx + b| = 1$ ，因此得到最大化距离：
$\ \frac{2}{||w||}$
将求解 $d$ 的最大化问题转化为最小化问题，之所以这样做是为了方便对目标函数进行求导，不影响求解最优化问题，上述式子等效于下式：
$\ \frac{1}{2}||w||$
去除 $∣∣ w ∣∣$ 的根号，便于后续计算，得到：
$\ \frac{1}{2}||w||^2$
将目标函数与约束条件放在一起进行描述，得到最优化模型：
$\ \frac{1}{2}||w||^2 \ \ s.t. \ \ y_i(w^Tx_i + b) \ge 1 \ \ i = 1, 2, ..., n$
上述公式描述的是一个典型的不等式约束条件下的二次型函数优化问题，同时也是支持向量机的基本数学模型。

对偶问题

拉格朗日乘子法

如果集合中任意两个元素连线上的点也在集合中，那么这个集合就是凸集。

假设 $f (x)$ 是定义在区间 $L$ 上的函数，若对任意两点 $x_1, x_2$ 和任意的实数 $\lambda \in (0, 1)$ ，总有 $f(\lambda x_1 + (1 - \lambda)x_2) \leq \lambda f(x_1) + (1 - \lambda)f(x_2)$ ，则称 $f (x)$ 为 $L$ 上的凸函数。

通常，我们求解的最优化问题有如下几类：

无约束的优化问题，可以写成如下：
$min \ f(x_1, x_2, ..., x_n)$
对于此类问题，最常使用的方法便是费马定理，即求导，令导数为零，求出极值点。如果是凸函数，则能保证求出来的解是最优解。
有等式约束的优化问题，可以写成如下：
$min \ f(x_1, x_2, ..., x_n) \\ s.t. \ \ h_i(x_1, x_2, ..., x_n) = 0 \ \ i = 1, 2, ..., m$
对于此类问题，最常使用的方法便是拉格朗日乘子法（Lagrange Multiplier），即用一个系数将等式约束与目标函数写在一起，形如 $\lambda) = f(x) + \displaystyle\sum_{i=1}^{m}\lambda _ih_i(x)$ ， $\lambda)$ 称为拉格朗日函数，系数 $\lambda$ 称为拉格朗日乘子。

对拉格朗日函数中的各变量进行求导，令其为零，可求得候选值集合，最后通过验证求得最优值。

利用必要条件找到可能的极值点，判断是否为极值点，需要根据问题本身的具体情况进行检验，式子如下：
$\left\{\begin{matrix}\frac{\partial L}{\partial x_i} = 0 & i = 1, 2, ..., n\\ \frac{\partial L}{\partial \lambda _i} = 0 & i = 1, 2, ..., m \end{matrix}\right.$
上述方程组称为等式约束的极值必要条件。等式约束下的拉格朗日乘子法引入了 $m$ 个拉个朗日乘子，我们将 $x_i$ 与 $\lambda _i$ 都视作优化变量，因此共有 $(n + m)$ 个优化变量。
有不等式约束的优化问题，可以写成如下：
$\ f(x_1, x_2, ..., x_n) \\s.t. \ \ g_i(x_1, x_2, ..., x_n) \leq 0 \ \ i = 1, 2, ..., m$
对于此类问题，最常使用的方法便是 KKT 条件法。同样地，用系数将所有的等式、不等式约束与目标函数写在一起，写在一起的函数也称为拉格朗日函数，系数也叫拉格朗日乘子。

本文中的优化问题属于有不等式约束的优化，针对这种情况，主要思想是通过引入松弛变量将不等式约束转化为等式约束。

我们的最优化模型如下：
$\ \frac{1}{2}||w||^2 \\ s.t. \ \ g_i(w) = 1 - y_i(w^Tx_i + b) \leq 0 \ \ i = 1, 2, ..., n$
引入松弛变量 $a_i^2$ ，得到 $h_i(w, a_i) = g_i(w) + a_i^2 = 0$ 。这里加平方主要是为了不再引入新的约束条件，如果引入的松弛变量为 $a_i$ ，那我们必须要保证 $a_i \ge 0$ ，才能使得 $h_i(w, a_i) = 0$ 。

由此，我们将不等式约束转化为了等式约束，并得到拉格朗日函数：
$\lambda , a) = f(w) + \displaystyle\sum_{i=1}^{n}\lambda _ih_i(w) = f(w) + \displaystyle\sum_{i=1}^{n}\lambda _i[g_i(w) + a_i^2] \ \ \ \ \lambda _i \ge 0$
根据等式约束优化问题的极值必要条件，联立方程：
$\left\{\begin{matrix}\frac{\partial L}{\partial w_i} = \frac{\partial f}{\partial w_i} + \displaystyle\sum_{i=1}^{n}\lambda _i\frac{\partial g_i}{\partial w_i} = 0 \\ \frac{\partial L}{\partial a_i} = 2\lambda _ia_i = 0 \\ \frac{\partial L}{\partial \lambda _i} = g_i(w) + a_i^2 = 0 \\ \lambda _i \ge 0\end{matrix}\right.$
针对 $\lambda _i = 0$ ，有两种情况：

$\lambda _i = 0, a_i \ne 0$ 。由于 $\lambda _i = 0$ ，因此约束条件 $g_i(w)$ 不起作用，且 $g_i(w) < 0$ 。
$\lambda _i \ne 0, a_i = 0$ 。此时， $g_i(w) = 0$ 且 $\lambda _i > 0$ ，可以理解为约束条件 $g_i(w)$ 起作用了，且 $g_i(w) = 0$ 。
综合可得， $\lambda _ig_i(w) = 0$ ，且在约束条件起作用时，有 $\lambda _i > 0, g_i(w) = 0$ ；在约束条件不起作用时，有 $\lambda _i = 0, g_i(w) < 0$ 。

由此，上述方程组转换为：
$\left\{\begin{matrix}\frac{\partial L}{\partial w_i} = \frac{\partial f}{\partial w_i} + \displaystyle\sum_{i=1}^{n}\lambda _i\frac{\partial g_i}{\partial w_i} = 0 \\ \lambda _ig_i(w) = 0 \\ g_i(w) \leq 0 \\ \lambda _i \ge 0\end{matrix}\right.$
以上便是不等式约束优化问题的 KKT（Karush-Kuhn-Tucker）条件， $\lambda _i$ 称为 KKT 乘子。上述式子直观地告诉我们，支持向量 $g_i(w) = 0$ ，满足 $\lambda _i > 0$ 即可；其他向量 $g_i(w) < 0$ ，需满足 $\lambda _i = 0$ 。

根据最优化模型，我们要求的是：
$\ \frac{1}{2}||w||^2 \\ s.t. \ \ g_i(w) = 1 - y_i(w^Tx_i + b) \leq 0 \ \ i = 1, 2, ..., n$
即求 $\ L(w, \lambda, a)$ ， $\lambda, a)$ 写成如下：
$\lambda , a) = f(w) + \displaystyle\sum_{i=1}^{n}\lambda _i[g_i(w) + a_i^2] = f(w) + \displaystyle\sum_{i=1}^{n}\lambda _ig_i(w) + \displaystyle\sum_{i=1}^{n}\lambda _ia_i^2$
由于 $\displaystyle\sum_{i=1}^{n}\lambda _ia_i^2 \ge 0$ ，故我们可以将上述问题转化为求 $\ L(w, \lambda)$ ，如下所示：
$\lambda) = f(w) + \displaystyle\sum_{i=1}^{n}\lambda _ig_i(w)$
假设目标函数找到了最佳参数，并取得了最小值 $p > 0$ ，即 $\ \frac{1}{2}||w||^2 = p$ 。根据上述可知， $\lambda _i \ge 0, g_i(w) \leq 0, \displaystyle\sum_{i=1}^{n}\lambda _ig_i(w) \leq 0$ ，因此 $\ L(w, \lambda) = min \ f(w) + min \ \displaystyle\sum_{i=1}^{n}\lambda _ig_i(w) = p + min \ \displaystyle\sum_{i=1}^{n}\lambda _ig_i(w)$ 。而要使得 $\displaystyle\sum_{i=1}^{n}\lambda _ig_i(w)$ 最小，就要使得 $\lambda_i$ 最大。故最优化问题可转化为如下：
$\ L(w, \lambda) = \min_{w}{\max_{\lambda}{L(w, \lambda)}} \ \ s.t. \ \ \lambda _i \ge 0$

强对偶性

对偶问题就是将以下式子：
$\min_{w}{\max_{\lambda}{L(w, \lambda)}} \ \ s.t. \ \ \lambda _i \ge 0$
变成了以下式子：
$\max_{\lambda}{\min_{w}{L(w, \lambda)}} \ \ s.t. \ \ \lambda _i \ge 0$
假设对于函数 $f (x)$ ，有：
$\ max \ f(x) \ge max \ min \ f(x)$
也就是说，从最大的里面挑出来最小的也要比从最小的里面挑出来最大的大，这就是弱对偶关系，当且仅当等号成立时，满足强对偶关系。

满足以下两点，强对偶关系便能成立：

对目标函数进行的优化属于凸优化问题。凸优化问题的定义：求取最小值的目标函数为凸函数的一类优化问题。
满足 KKT 条件，KKT 条件是强对偶性的充要条件。

SVM 优化

我们已知 SVM 的优化问题为：
$\min_w \ \frac{1}{2}||w||^2 \\ s.t. \ \ g_i(w, b) = 1 - y_i(w^Tx_i + b) \leq 0 \ \ \ \ i = 1, 2, ..., n$
求解线性可分的 SVM 分类器的步骤为：

构造拉格朗日函数：
$\min_{w, b}{\max_{\lambda}{L(w, b, \lambda)}} = \frac{1}{2}||w||^2 + \displaystyle\sum_{i=1}^{n}\lambda _i[1 - y_i(w^Tx_i + b)] \ \ s.t. \ \ \lambda _i \ge 0$
利用强对偶性进行转化（便于后续求导等操作）：
$\min_{w, b}{\max_{\lambda}{L(w, b, \lambda)}} = \max_{\lambda}{\min_{w, b}{L(w, b, \lambda)}}$
固定 $\lambda$ ，分别对参数 $w$ 和参数 $b$ 求偏导（ $\lambda)$ 关于 $w 、 b$ 最小化）：
$\frac{\partial L}{\partial w} = w - \displaystyle\sum_{i=1}^{n}\lambda _ix_iy_i = 0 \\\frac{\partial L}{\partial b} = \displaystyle\sum_{i=1}^{n}\lambda _iy_i = 0$
将上述结果带回到拉格朗日函数：
$\lambda) = \frac{1}{2}||w||^2 + \displaystyle\sum_{i=1}^{n}\lambda _i[1 - y_i(w^Tx_i + b)] \\ = \frac{1}{2}w^Tw + \displaystyle\sum_{i=1}^{n}\lambda _i - w^T\displaystyle\sum_{i=1}^{n}\lambda _iy_ix_i - b\displaystyle\sum_{i=1}^{n}\lambda _iy_i \\ = \frac{1}{2}w^T\displaystyle\sum_{i=1}^{n}\lambda _iy_ix_i - w^T\displaystyle\sum_{i=1}^{n}\lambda _iy_ix_i - b · 0 + \displaystyle\sum_{i=1}^{n}\lambda _i \\ = \displaystyle\sum_{i=1}^{n}\lambda _i - \frac{1}{2}\displaystyle\sum_{i=1}^{n}\displaystyle\sum_{j=1}^{n}\lambda_i\lambda_jy_iy_jx_i^Tx_j$
此时， $\lambda)$ 只存在一个变量，即 $\lambda$ 。
内部的最小值求解完成，接着求解外部的最大值：
$\max_\lambda \ [\displaystyle\sum_{i=1}^{n}\lambda _i - \frac{1}{2}\displaystyle\sum_{i=1}^{n}\displaystyle\sum_{j=1}^{n}\lambda_i\lambda_jy_iy_jx_i^Tx_j] \\s.t. \ \ \displaystyle\sum_{i=1}^{n}\lambda _iy_i = 0 \\\lambda _i \ge 0$
优化问题变成了上述形式，这是一个二次规划问题，对于此类问题，常用序列最小优化（Sequential Minimal Optimization，SMO）算法进行求解。

SMO 算法的核心思想非常简单，每次只优化一个参数，而固定住其他参数，仅求解当前这个优化参数的极值。

SMO 算法每次只优化一个参数，但我们的目标函数有约束条件 $\displaystyle\sum_{i=1}^{n}\lambda _iy_i = 0$ ，没法一次只变动一个参数，所以我们选择一次变动两个参数。具体步骤如下：
- 选择两个需要更新的参数 $\lambda _i、\lambda _j$ ，固定其他参数，于是得到以下约束：
  $\lambda _iy_i + \lambda_jy_j = c \ \ \ \ \lambda _i \ge 0, \ \lambda _j \ge 0$
  其中 $-\displaystyle\sum_{k \ne {i, j}}\lambda _ky_k$ ，由此得出 $\lambda_j = \frac{c - \lambda_iy_i}{y_i}$ ，也就是说，我们可以用 $\lambda _i$ 的表达式替代 $\lambda _j$ ，这样就相当于把目标问题转化成了仅有一个约束条件 $\lambda_i \ge 0$ 的最优化问题。
- 对于仅有一个约束条件的最优化问题，可以对 $\lambda _i$ 进行求偏导，令导数为零，求出变量值 $\lambda _{i\_{new}}$ ，然后根据 $\lambda _{i\_{new}}$ 求出 $\lambda _{j\_{new}}$ 。
- 多次迭代，直至收敛。
通过 SMO 算法求得最优解 $\lambda ^*$ 。
构造最大间隔超平面：
$\displaystyle\sum_{i=1}^{n}\lambda _iy_ix_i \\1 - y_i(w^Tx_i + b) = 0$
$w$ 是已经求得的。我们知道所有 $\lambda _i > 0$ 对应的点都是支持向量，那么我们可以随便找个支持向量，将其代入式子 $1 - y_s(w^Tx_s + b) = 0$ ，两边同乘 $y_s$ ，因为 $y_s^2 = 1$ ，因此得到 $b = y_s - w^Tx_s$ 。为了更具鲁棒性，可以求得支持向量的均值：
$\frac{1}{|S|}\displaystyle\sum_{s \in S}(y_s - w^Tx_s)$
至此， $w$ 和 $b$ 均已求出。

进而构造出最大间隔超平面 $w^Tx + b = 0$ 。

分类决策函数 $f(x) = sign(w^Tx + b)$ ，其中 $s i g n (\cdot)$ 为阶跃函数：
$\left\{\begin{matrix} -1 & x < 0 \\ 0 & x = 0 \\ 1 & x > 0 \end{matrix}\right.$
将新样本点导入到决策函数中，即可得到样本的分类结果。

软间隔

解决问题

在实际应用中，完全线性可分的样本集是很少的，如果遇到了无法实现完全线性可分的样本集，该怎么办？如下图所示：

为了解决上述问题，就提出了软间隔，相比于硬间隔的苛刻条件，软间隔允许个别样本点出现在间隔带里面。也就是说，我们允许部分样本点不满足约束条件 $y_i(w^Tx_i + b) \leq 0$ 。为了度量这个间隔软到何种程度，我们为每个样本引入了一个松弛变量 $\xi _i$ ，令 $\xi _i \ge 0$ ，且 $y_i(w^Tx_i + b) - \xi _i \leq 0$ 。如下图所示：

优化目标及求解

增加软间隔后，优化目标就变成了如下：
$\min_w \ \frac{1}{2}||w||^2 + C\displaystyle\sum_{i=1}^{n}\xi _i \\ s.t. \ \ g_i(w, b) = 1 - y_i(w^Tx_i + b) - \xi _i \leq 0 \ \ \ \ \xi _i \ge 0, \ \ i = 1, 2, ..., n$
其中， $C$ 是一个大于 $0$ 的常数（惩罚参数），可以理解为对错误样本的惩罚程度。若 $C$ 为无穷大， $\xi _i$ 必然为无穷小，如此一来线性 SVM 就又变成了线性可分，当 $C$ 为有限值时，才会允许部分样本不遵循约束条件。

接下来，我们将针对新的优化目标进行最优化问题求解，求解步骤如下：

构造拉个朗日函数：
$\min_{w, b, \xi}{\max_{\lambda, \mu}{L(w, b, \xi, \lambda, \mu)}} = \frac{1}{2}||w||^2 + C\displaystyle\sum_{i=1}^{n}\xi _i + \displaystyle\sum_{i=1}^{n}\lambda _i[1 - \xi _i - y_i(w^Tx_i + b)] - \displaystyle\sum_{i=1}^{n}\mu _i\xi _i \\ s.t. \ \ \lambda _i \ge 0 \ \ \ \ \mu _i \ge 0$
其中， $\lambda_i、\mu_i$ 是拉格朗日乘子， $w、b、\mu_i$ 是优化问题的参数。
利用强对偶性进行转化：
$\min_{w, b, \xi}{\max_{\lambda, \mu}{L(w, b, \xi, \lambda, \mu)}} = \max_{\lambda, \mu}{\min_{w, b, \xi}{L(w, b, \xi, \lambda, \mu)}}$
分别对参数 $w、b、\xi_i$ 求偏导，并令偏导为零，得到如下关系：
$\displaystyle\sum_{i=1}^{n}\lambda _iy_ix_i \\ 0 = \displaystyle\sum_{i=1}^{n}\lambda _iy_i \\ C = \lambda_i + \mu_i$
将上述结果带回到拉格朗日函数：
$\min _{w, b, \xi} \ L(w, b, \xi, \lambda, \mu) = \displaystyle\sum_{i=1}^{n}\lambda _i - \frac{1}{2}\displaystyle\sum_{i=1}^{n}\displaystyle\sum_{j=1}^{n}\lambda_i\lambda_jy_iy_jx_i^Tx_j$
最小化结果只有 $\lambda$ ，而没有 $\mu$ ，所以只需要最大化 $\lambda$ 就好。
内部的最小值求解完成，接着求解外部的最大值：
$\max_\lambda \ [\displaystyle\sum_{i=1}^{n}\lambda _i - \frac{1}{2}\displaystyle\sum_{i=1}^{n}\displaystyle\sum_{j=1}^{n}\lambda_i\lambda_jy_iy_jx_i^Tx_j] \\s.t. \ \ \displaystyle\sum_{i=1}^{n}\lambda _iy_i = 0 \\\lambda _i \ge 0 \\C - \lambda_i - \mu_i = 0$
可以发现，软间隔与硬间隔相似，只是多了个约束条件。

利用 SMO 算法求解最优拉格朗日乘子 $\lambda ^*$ 。
构造最大间隔超平面：
$\displaystyle\sum_{i=1}^{n}\lambda _iy_ix_i \\b = \frac{1}{|S|}\displaystyle\sum_{s \in S}(y_s - w^Tx_s)$
将求得的 $\lambda_i$ 代入上式，得到 $w$ 和 $b$ ，最终求得超平面 $w^Tx + b = 0$ 。

核函数

线性不可分

上述讨论的硬间隔和软间隔都是在说样本集的完全线性可分或大部分线性可分，但是我们可能会碰到的一种情况是样本点不是线性可分的，如下图所示：

这种情况的解决办法就是，将二维空间中线性不可分的样本点映射到高维空间中，让样本点在高维空间中实现线性可分，如下图所示：

对于在有限维度向量空间中线性不可分的样本，我们将其映射到更高维度的向量空间里，再通过间隔最大化的方式，学习得到的支持向量机，就是非线性 SVM。

我们用 $x$ 表示原来的样本点，用 $\phi (x)$ 表示 $x$ 映射到新的特征空间后得到的新向量，那么分隔的超平面可以表示为 $w\phi (x) + b$ 。

对于非线性 SVM，对偶问题就变成了如下：
$\min_\lambda \ [\frac{1}{2}\displaystyle\sum_{i=1}^{n}\displaystyle\sum_{j=1}^{n}\lambda _i\lambda _jy_iy_j(\phi (x_i) · \phi (x_j)) - \displaystyle\sum_{i=1}^{n}\lambda _i] \\s.t. \ \ \displaystyle\sum_{i=1}^{n}\lambda _iy_i = 0 \\\lambda _i \ge 0 \\C - \lambda_i - \mu_i = 0$
可以看到非线性 SVM 与线性 SVM 唯一的不同之处，就是之前的 $x_i · x_j)$ 变成了 $(\phi (x_i) · \phi (x_j))$ 。

核函数的作用

为什么需要核函数呢？这是因为低维空间映射到高维空间后，维度可能会很大，如果对全部样本进行点乘计算，可能会耗费很大的计算量。

但如果存在这样的一个核函数 $(\phi (x_i), \phi (x_j))$ ，使得 $x_i$ 与 $x_j$ 在特征空间的内积等于它们在原始样本空间中通过函数 $k (x, y)$ 计算得到的结果，我们就不需要计算高维甚至无穷维空间的内积了。

举个例子，假设我们有一个多项式核函数：
$k(x, y) = (x · y + 1)^2$
将样本点代入：
$(\displaystyle\sum_{i=1}^{n}(x_i · y_i) + 1)^2$
展开后：
$\displaystyle\sum_{i=1}^{n}x_i^2y_i^2 + \displaystyle\sum_{i=2}^{n}\displaystyle\sum_{j=1}^{i-1}(\sqrt 2x_ix_j)(\sqrt 2y_iy_j) + \displaystyle\sum_{i=1}^{n}(\sqrt 2x_i)(\sqrt 2y_i) + 1$
如果没有核函数，则需要把原样本点向量映射为：
$(x_1^2, ..., x_n^2, ..., \sqrt 2x_1, ..., \sqrt 2x_n, 1)$
再将其运用于内积计算，才能与多项式核函数达到相同的效果。

可见核函数的引入一方面减少了计算量，另一方面也减少了存储数据时的内存消耗。

常见核函数

常用的核函数有如下：

线性核函数：
$k(x_i, x_j) = x_i^Tx_j$
多项式核函数：
$k(x_i, x_j) = (x_i^Tx_j)^d$
高斯核函数：
$k(x_i, x_j) = e^{-\frac{||x_i - x_J||}{2\sigma ^2}}$

上述是三个常用的核函数，其中只有高斯核函数是需要调参的。

SVM 算法优缺点

优点

有严格的数学理论支持，可解释性强，不依靠统计方法，从而简化了通常的分类和回归问题；
能找出对任务至关重要的关键样本（即支持向量）；
采用核技巧之后，可以处理非线性分类/回归任务；
最终决策函数只由少数的支持向量所确定，计算的复杂性取决于支持向量的数目，而不是样本空间的维数，这在某种意义上避免了“维数灾难”。

缺点

训练时间长。当采用 SMO 算法时，由于每次都需要挑选一对参数，因此时间复杂度为 $O(N^2)$ ，其中 $N$ 为训练样本的数量；
当采用核技巧时，如果需要存储核矩阵，则空间复杂度为 $O(N^2)$ ；
模型预测时，预测时间与支持向量的个数成正比。当支持向量的数量较大时，预测计算复杂度较高。

因此支持向量机目前只适合小批量样本的任务，无法适应百万甚至上亿样本的任务。

你可能感兴趣的:(机器学习,支持向量机,算法,机器学习)

day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
力扣面试题07 - 旋转矩阵茶猫_ leetcode 矩阵算法 c语言
题目：给你一幅由N×N矩阵表示的图像，其中每个像素的大小为4字节。请你设计一种算法，将图像旋转90度。不占用额外内存空间能否做到？示例1:给定matrix=[[1,2,3],[4,5,6],[7,8,9]],原地旋转输入矩阵，使其变为:[[7,4,1],[8,5,2],[9,6,3]]示例2:给定matrix=[[5,1,9,11],[2,4,8,10],[13,3,6,7],[15,14,12,
模拟退火(SA)：如何“故意走错路”，才能找到最优解？小瑞瑞acd 小瑞瑞学数模模拟退火算法 python 启发式算法算法
模拟退火(SA)：如何“故意走错路”，才能找到最优解？图示模拟退火算法如何通过接受较差解（橙色虚线标注）从局部最优（绿色点）逃逸，最终找到全局最优解（紫色点），展示其跳出局部极小值的能力。大家好，我是小瑞瑞！欢迎回到我的专栏！想象一下，你站在一座连绵不绝的山脉中，目标是找到海拔最低的那个山谷。你手上只有一个高度计，视野被浓雾笼罩，只能看清脚下的一小片区域。如果你是一个“贪心”的登山者，你的策略会非
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
量子计算解决气候变化：科学家找到了新方法大力出奇迹985 量子计算
气候变化已成为全球面临的严峻挑战，传统计算方法在应对与之相关的复杂问题时存在诸多局限。而量子计算作为新兴技术，为解决气候变化难题带来曙光。本文深入剖析科学家利用量子计算应对气候变化的新方法。量子计算凭借独特的量子比特与量子特性，在加速气候模型计算、优化模型参数、预测极端天气事件等方面展现出巨大优势。同时，在可再生能源整合、电网管理、碳捕获等实际应用场景中也发挥着重要作用。尽管目前面临硬件和算法等方
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
数据中台中的数据科学工作台：Jupyter集成方案 AI大数据智能洞察大数据与AI人工智能 jupyter 信息可视化 ide ai
数据中台中的数据科学工作台：Jupyter集成方案关键词：数据中台、数据科学工作台、JupyterNotebook、数据科学、机器学习、数据可视化、协作开发摘要：本文深入探讨了在数据中台架构中集成JupyterNotebook作为数据科学工作台的完整解决方案。我们将从数据中台的基本概念出发，详细分析Jupyter在数据科学工作流中的核心作用，介绍多种集成方案和技术实现细节，并通过实际案例展示如何构
算法刷题-动态规划之背包问题
1.背包问题之01（4.30）题目描述小明有一个容量为VV的背包。这天他去商场购物，商场一共有NN件物品，第ii件物品的体积为wiwi，价值为vivi。小明想知道在购买的物品总体积不超过VV的情况下所能获得的最大价值为多少，请你帮他算算。输入描述输入第11行包含两个正整数N,VN,V，表示商场物品的数量和小明的背包容量。第2∼N+12∼N+1行包含22个正整数w,vw,v，表示物品的体积和价值。1
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
顺时针旋转N * N 的矩阵忆杰算法 Python 矩阵 python 算法
顺时针旋转题目描述数据范围实现逻辑代码实现题目描述有一个NxN整数矩阵，请编写一个算法，将矩阵顺时针旋转90度。给定一个NxN的矩阵，和矩阵的阶数N,请返回旋转后的NxN矩阵。数据范围0852789963'''#第N列逆序后变成第N行#或者是第i行变成第N-i-1列代码实现classSolution:#列转换为行defline2Row(self,mat,n):arr=[]forlineinrang
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
【经典面试题】【JVM与性能调优】垃圾回收算法（标记-清除算法/复制算法/标记-整理算法/CMS/G1/ZGC）本本本添哥归档 -Inbox1 001 -基础开发能力面试题目汇总 jvm 算法
JVM自动管理内存，当对象不再被引用时，垃圾回收器（GarbageCollector）会自动释放这些对象占用的内存。标记-清除算法（Mark-Sweep）：标记垃圾再清除，会产生碎片。复制算法（Copying）：将存活对象复制到新区域，适合新生代，无碎片但浪费空间。标记-整理算法（Mark-Compact）：标记后将存活对象移到一端，清除另一端，适合老年代。分代收集算法（GenerationalC
从零到一：基于差分隐私决策树的客户购买预测系统实战开发笙囧同学决策树算法机器学习
作者简介：笙囧同学，中科院计算机大模型方向硕士，全栈开发爱好者联系方式：[email protected]各大平台账号：笙囧同学座右铭：偷懒是人生进步的阶梯文章导航快速导航前言-项目背景与价值项目概览-系统架构与功能技术深度解析-核心算法原理️系统实现详解-工程实践细节性能评估与分析-实验结果分析Web系统开发-前后端开发部署与运维-DevOps实践完整复现指南-手把手教程️实践案例与故障排除-问
基于随机森林的白酒风味智能分类系统：从数据到洞察的完整实践笙囧同学 python
作者：笙囧同学|中科院计算机大模型方向硕士|全栈开发爱好者座右铭：偷懒是人生进步的阶梯联系方式：[email protected]各大平台账号/公众号：笙囧同学前言大家好，我是笙囧同学！今天给大家分享一个超级有趣且技术含量爆表的项目——白酒风味智能分类系统。作为一个既爱技术又爱美酒的程序员，我花了大量时间研究如何用机器学习的方法来"品酒"，让AI帮我们识别白酒的风味特征。这个项目融合了机器学习、数
CMS垃圾回收器+G1垃圾回收器+ZGC垃圾回收器详解及对比 weixin_43751710 jvm java 算法
一、CMS收集器CMS(ConcurrentMarkSweep)收集器是一种以获取最短回收停顿时间为目标的收集器，是一款针对老年代的垃圾回收器，一般和Parallel回收器（一款新生代回收器，是使用复制算法的收集器，又是并行的多线程收集器，收集时会Stoptheworld）配合使用。1.工作过程从名字（包含“MarkSweep”）上就可以看出CMS收集器是基于标记-清除算法实现的，它的运作整个过程
负载均衡-加权随机算法 BP白朴 Nginx 负载均衡 java 算法服务器
负载均衡-加权随机算法由于访问概率大致相同，所以如果部分服务器性能不一致的话，容易导致性能差的服务器压力过大，所以要根据服务器性能不一致的情况，给性能好的服务器多处理请求，给差的少分配请求（能者多劳）所以就需要在随机算法的基础上给每台服务器设置权重，延伸为加权随机算法1、将应用服务器集群的IP存到Map里,每个IP对应有一个权重2、创建一个List,来将所有权重下的IP存到list里面如：192.
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$