【机器学习】西瓜书 03 线性回归模型

03 线性模型

文章目录

03 线性模型
- 机器学习三要素
- 3.1 一元线性回归算法原理
- - 3.1.1最小二乘法
  - 3.1.2极大似然估计法
- 3.2 参数估计
- - 凸集
  - 凸函数
  - 凸充分性定理
  - 梯度
  - Hessian矩阵
  - 3.2.1证明 $E_{(w,b)}$ 是关于 $w$ 和 $b$ 的凸函数
  - 3.2.2求解损失函数的参数
  - 3.2.3向量化
  - 3.2.4 多元线性回归
  - 3.2.5 矩阵微分
  - 3.2.6 对数线性回归
- 3.3 Logistic 回归（解决分类问题）
- - 3.3.1 联系函数
  - 3.3.2 参数估计
  - - 3.3.2.1 极大似然估计
    - 3.3.2.2 信息熵
    - - 自信息
      - 信息熵
      - 相对熵（KL散度）
- 3.4 线性判别分析
- - 广义特征值
  - 广义瑞利商

机器学习三要素

模型：根据具体问题，确定假设空间
策略：根据评价标准，确定选取最优模型的策略（通常会导出一个损失函数）
1. 策略一：最小二乘法
2. 策略二：极大似然估计法
算法：求解损失函数，确定最优模型
1. 闭式解
2. 近似最值解

3.1 一元线性回归算法原理

考虑这样一个问题：我们拥有程序员的发际线高度 $X={x_1,x_2,...x_i,...x_m}$ ，和她们的计算机水平 $Y={y_1,y_2,...,y_i,...,y_m}$ 的一批数据，现在来研究这两者之间的关系。根据数据散点图，我们可以直观地画出一条直线 $f (x) = w x + b$ ，令这些数据点 $x_i,y_i)$ 到直线的距离最短，那么这条直线就是所求的线性回归模型。其中，观察点到直线的距离，可以是垂直距离（绿色线段），也可以是欧式距离 $y - f (x)$ （红色线段）。我们把依赖于前者的方法叫作正交回归，依赖于后者的方法叫作线性回归。

上述问题是简单的一元回归问题，从发际线高度这一特征，来预测其计算机水平。当然还有很多其他的案例，比如信用卡额度预测问题，特征是用户的信息（如年龄，性别，年薪……），我们来预测给用户多大的信用额度，这样类似的问题都是回归问题，目标值 $y$ 隶属于实数空间 $R$ 。

根据输入特征的数目和特征值之间的“序”关系，我们可以对特征取值进行转化。

仅通过 发际线高度 预测 计算机水平：

$f(x)=w_1x_1+b$
+二值离散特征颜值 (好看：1，不好看：0)

$f(x)=w_1x_1+w_2x_2+b$
+有序的多值离散特征饭量 (小：1，中：2，大：3)

$f(x)=w_1x_1+w_2x_2+w_3x_3+b$
+无序的多值离散特征肤色 (黄：[1,0,0]，黑：[0,1,0]，白：[0,0,1])

$f(x)=w_1x_1+w_2x_2+w_3x_3+w_4x_4+w_5x_5+w_6x_6+b$

3.1.1最小二乘法

本书中讨论的是线性回归问题，线性回归假设 $f(x)=w^Tx+b$ 。我们用均方误差作为回归问题中的性能度量，得到损失函数 $E_{(w,b)}$ 。

$E_{(w,b)}=\Sigma_{i=1}^m(y_i-f(x_i))^2=\Sigma_{i=1}^m(y_i-wx_i-b)^2$

基于均方误差最小化对模型求解的方法称为 最小二乘法（Least Square Method），表达式为 $\arg\min_{(w,b)}\Sigma_{i=1}^m(y_i-wx_i-b)^2$ ，这里的 $arg\min_{(w,b)}$ 表示求解使得式子达到最小值的 $w$ 和 $b$ 。

3.1.2极大似然估计法

根据一元线性回归公式推导，我们发现使用极大似然估计(Maximum Likelihood Estimation)可以得到同样的损失函数。

目的：估计概率分布的参数值，如正态分布的参数均值和方差 $\mu,\sigma^2$

方法：对于离散随机变量 $X=\{x_1,x_2,...,x_n\}$ ， $x_i$ 是已知的独立同分布(i.i.d)随机变量，假设概率质量函数 $P(x;\theta)$ ， $\theta$ 为待估计的参数(可以是多个参数)，那么 似然函数 为 $L(\theta)=\prod_{i=1}^nP(x_i;\theta)$ 。我们考虑使得观测样本出现概率最大的分布，就是所求的分布。

根据线性回归假设，再考虑随机误差 $\epsilon \sim N(0,\sigma^2)$ ，我们可以得到线性模型 $y=wx+b+\epsilon$ 。

根据正态分布概率密度函数公式， $p(\epsilon)=\frac{1}{\sqrt{2\pi}\sigma}\exp(-\frac{\epsilon^2}{2\sigma^2})$ ，

把 $\epsilon=y-wx-b$ 代入上述公式，得到 $y$ 的概率密度函数： $p(y)=\frac{1}{\sqrt{2\pi}\sigma}\exp(-\frac{(y-(wx+b))^2}{2\sigma^2})$ ，

即 $\sim N(wx+b,\sigma^2)$ 。

计算似然函数 $L(w,b)=\prod_{i=1}^mp(y_i)=\prod_{i=1}^m\frac{1}{\sqrt{2\pi}\sigma}\exp(-\frac{(y_i-(wx_i+b))^2}{2\sigma^2})$ ，

为了便于计算，对似然函数取对数，变乘为加， $\ln L(w,b)=\Sigma_{i=1}^m\ln\frac{1}{\sqrt{2\pi}\sigma}+\Sigma_{i=1}^m\ln\exp(-\frac{(y_i-(wx_i+b))^2}{2\sigma^2})=m\ln\frac{1}{\sqrt{2\pi}\sigma}+-\frac{1}{2\sigma^2}\Sigma_{i=1}^m(y_i-(wx_i+b))^2$

对 $\ln L(w,b)$ 取最大值，可等价于对 $\Sigma_{i=1}^m(y_i-(wx_i+b))^2$ 取最小值，即 $\arg\min_{(w,b)}\Sigma_{i=1}^m(y_i-wx_i-b)^2$ ，与最小二乘法殊途同归。

3.2 参数估计

由最小二乘法和极大似然函数估计法，我们得到同一个 $E_{(w,b)}$ ，接下来对参数 $w$ 和 $b$ 进行求解，即参数估计。

首先 $E_{(w,b)}$ 是关于 $w$ 和 $b$ 的凸函数 ，那么当它关于二者的导数均为零时，就得到了 $w$ 和 $b$ 的最优解。

为了理解并求证“ $E_{(w,b)}$ 是关于 $w$ 和 $b$ 的凸函数”这一含义，这里需明确一些概念。

凸集

数学定义： $x,y\in D$ ，任意 $\alpha\in[0,1]$ ，存在 $\alpha x+(1-\alpha)y \in D$ ，那么 $D$ 是凸集。

几何意义：两点属于一个集合，且两点连线上任意一点都属于此集合，称为凸集。

凸函数

数学定义：对区间 $[a, b]$ 上定义的函数 $f$ ，若它对区间中任意两点 $x_1,x_2$ 均有 $f(\frac{x_1+x_2}{2})\leq \frac{f(x_1)+f(x_2)}{2}$ ，则称 $f$ 为区间 $[a, b]$ 上的凸函数。

例子：U型函数如 $f(x)=x^2$

凸充分性定理

若 $f$ 是凸函数，且 $f (x)$ 一阶连续可微，则 $x^*$ 是全局解的充要条件是 $\nabla f(x^*)=0$ 。

梯度

多元函数的一阶导数，对各个分量求偏导。

Hessian矩阵

同上，取二阶偏导数。

3.2.1证明 $E_{(w,b)}$ 是关于 $w$ 和 $b$ 的凸函数

根据定理：设 $D$ 是非空开凸集， $f (x)$ 在 $D$ 上二阶连续可微，如果 $f (x)$ 的Hessian矩阵在 $D$ 上半正定，则 $f (x)$ 是 $D$ 上的凸函数。

需证明 $\nabla^2E_{(w,b)}$ 是半正定矩阵。

半正定矩阵的判定定理：若实对称矩阵的所有顺序主子式均为非负，则该矩阵是半正定。

顺序主子式：第1到第n阶行列式

$D_1$ : $|2\Sigma_{i=1}^mx_i^2|>0$

$D_2$ : $\left| \begin{array}{cccc} 2 \Sigma_{i=1}^mx_i^2 & 2 \Sigma_{i=1}^mx_i\\ 2 \Sigma_{i=1}^mx_i & 2m \end{array} \right|$

求解 $D_2$ ，利用 $m\times\frac{1}{m}$ 来构造 $\bar{x}$ ，最终得到 $4m\Sigma_{i=1}^m(x_i-\bar{x})^2\geq 0$

即所有顺序主子式均为非负， $\nabla^2E_{(w,b)}$ 是半正定矩阵得证， $E_{(w,b)}$ 是关于 $w$ 和 $b$ 的凸函数得证。

3.2.2求解损失函数的参数

因为 $E_{(w,b)}$ 是关于 $w$ 和 $b$ 的凸函数，所以根据凸充分性定理， $\nabla E_{(w,b)}=0$ 的点是最小值点。

令 $\frac{\partial E_{(w,b)}}{\partial b}=0$ ，得 $b=\frac{1}{m}\Sigma_{i=1}^m(y_i-wx_i)$

为了便于求解 $w$ ，对 $b$ 化简， $b=\bar{y}-w\bar{x}$

令 $\frac{\partial E_{(w,b)}}{\partial w}=0$ ，得 $w\Sigma_{i=1}^m x_i^2=\Sigma_{i=1}^m y_ix_i-\Sigma_{i=1}^mbx_i$

把 $b=\bar{y}-w\bar{x}$ 代入，移项求出 $w$ ，再进行变换，最终得到 $w=\frac{\Sigma_{i=1}^my_i(x_i-\bar{x})}{\Sigma_{i=1}^mx_i^2-\frac{1}{m}(\Sigma_{i=1}^mx_i)^2}$

3.2.3向量化

始终把项目导向放在第一位，那么观察到 $w$ 中含有大量的求和运算，我们联想到实现中多层循环的复杂，因此考虑将其向量化。

主要思路：观察 $(x_i-\bar{x})$ 可以理解为去均值后的 $x_i$ ，那么构造类似的表达式，将上式变换为去均值后的 $x$ 与 $y$ 的表达式。

注重基础运算！

$w=\frac{\Sigma_{i=1}^m(x_i-\bar{x})(y_i-\bar{y})}{\Sigma_{i=1}^m(x_i-\bar{x})^2}=\frac{\vec{x}_d^T\vec{y}_d}{\vec{x}_d^T\vec{x}_d}$

3.2.4 多元线性回归

将 $\bold{w}$ 和 $b$ 组合成 $\hat{\bold{w}}$ ，得到线性模型 $f(\bold{\hat{x}_i})=\bold{\hat{w}^T}\bold{\hat{x}_i}$

由最小二乘法得 $E_{\hat{\bold{w}}}=(\bold{y}-\bold{X\hat{w}})^T(\bold{y}-\bold{X\hat{w}})$

证明半正定，对损失函数求Hessian矩阵。

3.2.5 矩阵微分

先求梯度

再求Hessian 矩阵

$\nabla^2E_{\bold{\hat{w}}}=2\bold{X}^T\bold{X}$

假设 $\bold{X}^T\bold{X}$ 为满秩矩阵或正定矩阵，那么凸函数得证。对一阶偏导取零，求得 $\bold{\hat{w}}^*=(\bold{X}^T\bold{X})^{-1}\bold{X}^T\bold{y}$

现实情况中，由于特征数会超过样例数，此时的 $\bold{X}^T\bold{X}$ 不是满秩矩阵，则需引入正则化项。

3.2.6 对数线性回归

$\ln y = \bold{w}^T\bold{x}+b$

上式在形式上是线性回归，实质上是求取非线性函数映射。

根据演绎法推演到一般情况，考虑单调可微函数 $g (.)$ ，令 $y=g^{-1}(\bold{w}^T\bold{x}+b)$ ，称其为广义线性模型， $g (.)$ 为联系函数。

3.3 Logistic 回归（解决分类问题）

考虑分类任务，我们使用3.2.6中提到的联系函数，来把分类任务中的真实标记 $y$ 和线性回归模型的预测值联系起来。

机器学习三要素

模型：线性模型，输出 $\in\{0,1\}$ ，近似阶跃的单调可微函数
策略：极大似然估计，信息论
算法：梯度下降，牛顿法

3.3.1 联系函数

单位阶跃函数(unit-step function)

该函数可以把实值 $z$ 转换为0/1值。

缺点：不连续，不能直接取反函数。

对数几率函数(logistic function)

$y=\frac{1}{1+e^{-z}}$ 一种Sigmoid函数（S型）

令 $z=\bold{w}^T\bold{x}+b$ ，则 $y=\frac{1}{1+e^{-(\bold{w}^T\bold{x}+b)}}$

两边取对数，可得 $\ln \frac{y}{1-y}=\bold{w}^T\bold{x}+b$

其中，令 $y = p (y = 1∣ x)$ ，则 $1 - y = p (y = 0∣ x)$ ，那么 $\frac{y}{1-y}$ 称为 几率（odds），反映了 $x$ 作为正例的相对可能性。对几率取对数，则得到对数几率（logit）。

掌握模型输出的含义： $y = p (y = 1∣ x)$ ，给定一个样本 $x$ ，输出 $y = 1$ 的可能性。

优点 :

直接建模，无需假设数据分布；
得到近似概率预测，可以辅助决策；
任意阶可导的凸函数，可求取最优解。

3.3.2 参数估计

使用数值优化算法，如：梯度下降、牛顿法得到损失函数的最优解 $\beta^*=\arg\min_\beta l(\beta)$ ，这里的最优解不是闭式解，而是近似解。

3.3.2.1 极大似然估计

确定概率质量函数

预测值 $\in \{0,1\}$ 取值为1和0的概率分别为

$p(y=1|x)=\frac{1}{1+e^{-(\bold{w}^T\bold{x}+b)}}=\frac{e^{\bold{w}^T\bold{x}+b}}{1+e^{\bold{w}^T\bold{x}+b}}$

$p(y=0|x)=1-p(y=1|x)=\frac{1}{1+e^{(\bold{w}^T\bold{x}+b)}}$

为便于讨论，令 $\bold{\beta}=(\bold{w};b)$ ， $\hat{\bold{x}}=(\bold{x};1)$ ，则上式简写为

$p(y=1|\hat{\bold{x}};\bold{\beta})=\frac{e^{\bold{\beta}^T\hat{\bold{x}}}}{1+e^{\bold{\beta}^T\hat{\bold{x}}}}=p_1(\hat{\bold{x}};\bold{\beta})$

$p(y=0|\hat{\bold{x}};\bold{\beta})=\frac{1}{1+e^{\bold{\beta}^T\hat{\bold{x}}}}=p_0(\hat{\bold{x}};\bold{\beta})$

合并后写成 $p(y|\hat{\bold{x}};\bold{\beta})=y\times p_1(\hat{\bold{x}};\bold{\beta})+(1-y)\times p_0(\hat{\bold{x}};\bold{\beta})$
写出似然函数

$L(\bold{\beta})=\prod_{i=1}^mp(y_i|\hat{\bold{x}}_i;\bold{\beta})$

对数似然函数是

$l(\bold{\beta})=\ln L(\bold{\beta})=\Sigma_{i=1}^m \ln p(y_i|\hat{\bold{x}}_i;\bold{\beta})=\Sigma_{i=1}^m \ln(y\times p_1(\hat{\bold{x}}_i;\bold{\beta})+(1-y)\times p_0(\hat{\bold{x}}_i;\bold{\beta}))$

将 $p_1(\hat{\bold{x}}_i;\bold{\beta})=\frac{e^{\bold{\beta}^T\hat{\bold{x}}_i}}{1+e^{\bold{\beta}^T\hat{\bold{x}}_i}}$ ， $p_0(\hat{\bold{x}}_i;\bold{\beta})=\frac{1}{1+e^{\bold{\beta}^T\hat{\bold{x}}_i}}$ 代入，得到

$l(\bold{\beta})=\Sigma_{i=1}^m(\ln(y_ie^{\bold{\beta}^T\hat{\bold{x}}_i}+1-y_i)-\ln(1+e^{\bold{\beta}^T\hat{\bold{x}}_i}))$

因为 $y_i \in \{0,1\}$

分类讨论 $y_i=0$ 和 $y_i=1$ 的情况，综合可得 $l(\bold{\beta})=\Sigma_{i=1}^m(y_i\bold{\beta}^T\hat{\bold{x}}_i-\ln(1+e^{\bold{\beta}^T\hat{\bold{x}}_i}))$

此时最大化 $l(\bold{\beta})$ 即为最小化相反数 $-l(\bold{\beta})$ 。

3.3.2.2 信息熵

自信息

$I(X)=-\log_bp(x)$

信息熵

度量随机变量X的不确定性，信息熵越大越不确定。

$H(X)=E[I(X)]=-\Sigma_xp(x)\log_bp(x)$

约定：若 $p (x) = 0$ ，则 $p(x)\log_bp(x)=0$

相对熵（KL散度）

度量两个分布的差异，用于度量理想分布 $p (x)$ 和模拟分布 $q (x)$ 之间的差异。

$D_{KL}(p||q)=\Sigma_xp(x)\log_b(\frac{p(x)}{q(x)})=\Sigma_xp(x)\log_bp(x)-\Sigma_xp(x)\log_bq(x)$

其中 $-\Sigma_xp(x)\log_bq(x)$ 称为交叉熵。

最小化相对熵，可以令 $q (x)$ 接近 $p (x)$ ，即求出最优分布。从频率学派的角度看， $p (x)$ 是固定的， $\Sigma_xp(x)\log_bp(x)$ 当作常量，因此最小化相对熵，就是最小化交叉熵 $-\Sigma_xp(x)\log_bq(x)$ 。

列出理想分布 $p (x)$ 和模拟分布 $q (x)$

写出交叉熵
1. 单个样本 $y_i$ 的交叉熵
  
  $-\Sigma_{y_i}p(y_i)\log_bq(y_i)=-p(1)\times\log_bp_1(\hat{\bold{x}};\bold{\beta})-p(0)\times\log_bp_0(\hat{\bold{x}};\bold{\beta})=-y_i\times\log_bp_1(\hat{\bold{x}};\bold{\beta})-(1-y_i)\times\log_bp_0(\hat{\bold{x}};\bold{\beta})$
  
  令 $b = e$ ，上式为
  
  $-y_i\times\ln p_1(\hat{\bold{x}};\bold{\beta})-(1-y_i)\times\ln p_0(\hat{\bold{x}};\bold{\beta})$
2. 全体样本的交叉熵
  
  $\Sigma_{i=1}^m[-y_i\times\ln p_1(\hat{\bold{x}}_i;\bold{\beta})-(1-y_i)\times\ln p_0(\hat{\bold{x}}_i;\bold{\beta})]$
  
  化简后得到
  
  $\Sigma_{i=1}^m[-y_i\ln(e^{\beta^T\hat{x}_i})-\ln(\frac{1}{1+e^{\beta^T\hat{x}_i}})]=\Sigma_{i=1}^m(-y_i\bold{\beta}^T\hat{\bold{x}}_i+\ln(1+e^{\bold{\beta}^T\hat{\bold{x}}_i}))$
  
  与极大似然估计得到的 $-l(\beta)$ 殊途同归

3.4 线性判别分析

Linear Discriminant Analysis，简称LDA

从几何角度来看，全体训练样本经过投影后：

异类样本的中心尽可能远

二范数：求向量的模长 $\max ||\bold{w}^T\bold{\mu}_0-\bold{w}^T\bold{\mu}_1||_2^2$

由于直接算投影长度不好操作，因此我们计算 $w$ 和 $\mu$ 的内积，如 $\bold{w}^T\bold{\mu}_0$ ，计算简便。已知 $w$ 的模长不影响正负类样本的中心距离，因此我们通过在正负类样本中心 $|\bold{\mu}_1|\cos\theta_1$ 和 $|\bold{\mu}_0|\cos\theta_0$ 乘以一个模长 $||\bold{w}||$ ，来得到内积的形式 $\bold{w}^T\bold{\mu}_0=||\bold{w}||\times |\bold{\mu}_0|\cos\theta_0$ ，实现计算的简化。
同类样本的方差尽可能小

此处的方差并非严格方差。

$\min \bold{w}^T\bold{\Sigma}_0\bold{w}+\bold{w}^T\bold{\Sigma}_1\bold{w}$

$\bold{w}^T\bold{\Sigma}_0\bold{w}=\bold{w}^T(\Sigma_{x\in X_0}(\bold{x}-\bold{\mu}_0)(\bold{x}-\bold{\mu}_0)^T)\bold{w}$

损失函数推导

$\max J=\frac{||\bold{w}^T\bold{\mu}_0-\bold{w}^T\bold{\mu}_1||_2^2}{\bold{w}^T\bold{\Sigma}_0\bold{w}+\bold{w}^T\bold{\Sigma}_1\bold{w}}=\frac{||(\bold{\mu}_0-\bold{\mu}_1)^T\bold{w}||_2^2}{\bold{w}^T(\bold{\Sigma}_0+\bold{\Sigma}_1)\bold{w}}=\frac{[(\bold{\mu}_0-\bold{\mu}_1)^T\bold{w}]^T (\bold{\mu}_0-\bold{\mu}_1)^T\bold{w}}{\bold{w}^T(\bold{\Sigma}_0+\bold{\Sigma}_1)\bold{w}}=\frac{\bold{w}^T(\bold{\mu}_0-\bold{\mu}_1)(\bold{\mu}_0-\bold{\mu}_1)^T\bold{w}}{\bold{w}^T(\bold{\Sigma}_0+\bold{\Sigma}_1)\bold{w}}$

$\max J=\frac{\bold{w^T\bold{S}_b\bold{w}}}{\bold{w^T\bold{S}_w\bold{w}}}$

目标问题：

$\min _w -\bold{w^T\bold{S}_b\bold{w}}$

s.t. $\bold{w^T\bold{S}_w\bold{w}}=1$

一旦把分母固定化，则可以求解这个最优化问题。

使用拉格朗日乘子法，求出局部极值点，这里的目标函数 $-\bold{w^T\bold{S}_b\bold{w}}=-||\bold{w}^T\bold{\mu}_0-\bold{w}^T\bold{\mu}_1||_2^2\leq0$ ，所以最大值为0。又因为异类样本的中心在几何角度看一定存在最值距离，所以一定存在最小值。
求解 $w$

$\min _w -\bold{w^T\bold{S}_b\bold{w}}$

s.t. $\bold{w^T\bold{S}_w\bold{w}}=1$ -> $\bold{w^T\bold{S}_w\bold{w}}-1=0$

拉格朗日函数为

$L(\bold{w},\lambda)=-\bold{w^T\bold{S}_b\bold{w}}+\lambda(\bold{w^T\bold{S}_w\bold{w}}-1)$

对 $w$ 求偏导

$\frac{\partial L(\bold{w},\lambda)}{\partial \bold{w}}=-(\bold{S}_b+\bold{S}_b^T)\bold{w}+\lambda(\bold{S}_w+\bold{S}_w^T)\bold{w}$

因为 $S_b$ 和 $S_w$ 是对称阵，所以 $\frac{\partial L(\bold{w},\lambda)}{\partial \bold{w}}=-2\bold{S}_b\bold{w}+2\lambda\bold{S}_w\bold{w}$

令上式等于0，得到 $\bold{S}_b\bold{w}=\lambda\bold{S}_w\bold{w}$

即求广义特征值问题。

$(\bold{\mu}_0-\bold{\mu}_1)(\bold{\mu}_0-\bold{\mu}_1)^T\bold{w}=\lambda\bold{S}_w\bold{w}$

令 $(\bold{\mu}_0-\bold{\mu}_1)^T\bold{w}=\gamma$ ，则 $\gamma(\bold{\mu}_0-\bold{\mu}_1)\bold{w}=\lambda\bold{S}_w\bold{w}$

得 $\bold{w}=\frac{\gamma}{\lambda}\bold{S}_w^{-1}(\bold{\mu}_0-\bold{\mu}_1)$

最终求解的 $\bold{w}$ 不关心其大小，只关心其方向，所以常数项 $\frac{\gamma}{\lambda}$ 可以任意取值，若取1，则得到公式(3.39)。

广义特征值

广义瑞利商

实数域中，厄米等于转置。

性质：

C++学习笔记（lambda函数） __TAT__ C&C++c++学习笔记
C++learningnote1、lambda函数的语法2、lambda函数的几种用法1、lambda函数的语法lambda函数的一般语法如下：[capture_clause](parameters)->return_type{function_body}capture_clause：需要捕获的变量，但要求该变量必须在这个作用域中。通常的捕获方式有以下几种：[]：不捕获任何变量[&]：按引用捕获变
通俗易懂：什么是Java虚拟机（JVM）？它的主要作用是什么？大龄下岗程序员 mysql java mysql spring
Java虚拟机（JavaVirtualMachine,JVM）是一种软件实现的抽象计算机，它负责执行Java字节码（Bytecode）。Java程序并不是直接在物理计算机上运行，而是先由Java编译器将源代码编译成与平台无关的字节码，然后由JVM负责读取字节码并在实际硬件架构上运行。JVM的主要作用包括以下几个方面：1.跨平台性-JVM是Java语言“一次编写，到处运行”（WriteOnce,Ru
ES-LTR粗排模块 poins jenkins 运维
ES-LTR粗排模块官方资源：https://github.com/HeiBoWang/elasticsearch-learning-to-rankElasticsearch学习排名插件使用机器学习提高搜索相关性排名。它为维基媒体基金会和Snagajob等地方的搜索提供了动力！这个插件有什么功能此插件：允许您在Elasticsearch中存储特征（Elasticsearch查询模板）记录特征得分（
python清华大学出版社答案_Python机器学习及实践 weixin_39805119 python清华大学出版社答案
第1章机器学习的基础知识1.1何谓机器学习1.1.1传感器和海量数据1.1.2机器学习的重要性1.1.3机器学习的表现1.1.4机器学习的主要任务1.1.5选择合适的算法1.1.6机器学习程序的步骤1.2综合分类1.3推荐系统和深度学习1.3.1推荐系统1.3.2深度学习1.4何为Python1.4.1使用Python软件的由来1.4.2为什么使用Python1.4.3Python设计定位1.4.
UNDERSTANDING HTML WITH LARGE LANGUAGE MODELS liferecords LLM 语言模型人工智能自然语言处理
UNDERSTANDINGHTMLWITHLARGELANGUAGEMODELS相关链接：arXiv关键字：大型语言模型、HTML理解、Web自动化、自然语言处理、机器学习摘要大型语言模型（LLMs）在各种自然语言任务上表现出色。然而，它们在HTML理解方面的能力——即解析网页的原始HTML，对于自动化基于Web的任务、爬取和浏览器辅助检索等应用——尚未被充分探索。我们为HTML理解模型（经过微调
Windows Edge 兼容性问题修复马卫斌前端工程师 edge
当遇到MicrosoftEdge浏览器的兼容性问题时，您可以尝试以下几种解决方案：解决方案1：通过注册表编辑器禁用渲染器完整性检查针对一些特定情况，您可能需要关闭Edge浏览器的渲染器完整性检查以解决兼容性问题。按照以下步骤操作：1.按Win+R键打开“运行”对话框，输入regedit并回车打开注册表编辑器。2.导航至以下路径：计算机\HKEY_LOCAL_MACHINE\SOFTWARE\Pol
OpenCV（一个C++人工智能领域重要开源基础库）简介愚梦者 OpenCV 人工智能人工智能 opencv c++图像处理计算机视觉开源
返回：OpenCV系列文章目录（持续更新中......）上一篇：OpenCV4.9.0配置选项参考下一篇：OpenCV4.9.0开源计算机视觉库安装概述引言：OpenCV（全称OpenSourceComputerVisionLibrary）是一个基于开放源代码发行的跨平台计算机视觉库，可以用来进行图像处理、计算机视觉和机器学习等领域的开发。该库由英特尔公司于1999年开始开发，最初是为了加速处理器
零基础机器学习(5)之线性回归模型的性能评估一只特立独行猪机器学习机器学习线性回归人工智能
文章目录线性回归模型的性能评估1.举例1-单一特征2.举例2-多特征线性回归模型的性能评估评估线性回归模型时，首先要建立评估的测试数据集（测试集不能与训练集相同），然后选择合适的评估方法，实现对线性回归模型的评估。回归任务中最常用的评估方法有均方误差、均方根误差和预测准确率（确定系数）。1.举例1-单一特征分别对两个模型进行评估，输入的测试集如表所示。面积/（m2）售价/（万元）面积/（m2）售价
AI推介-大语言模型LLMs论文速览（arXiv方向）：2024.03.20-2024.03.25 小小帅AIGC LLMs论文时报人工智能语言模型自然语言处理 LLM 大语言模型论文推送深度学习
文章目录~1.IterativeRefinementofProject-LevelCodeContextforPreciseCodeGenerationwithCompilerFeedback2.TrustAIatSemEval-2024Task8:AComprehensiveAnalysisofMulti-domainMachineGeneratedTextDetectionTechniques
【早安心语】壹典心理咨询
【2021-5-17】早安春夏秋冬Lifeishappybecauseofgiving,happinessisincreasedbysharing,thesoulhasahome,lifehasaway,onlybylearningtobealonewithoneself,thesoulwillbeclean,themindwillbemature,andtheheartwillbebroad.B
2022-05-14 败者食尘_40a0
本文结构速览：一、SQL题二、机器学习&概率论三、开放性问题01SQL题面试真题：现有一张用户签到表（user_sign_d）,标记用户每日是否签到，表结构如下sign_date:日期user_id:用户IDif_sign:当日是否签到,1表示签到，0表示未签到问题①：请计算截止到当前每个用户已经连续签到的天数（输出表仅包含当天签到的所有用户，计算其连续签到的天数）输出表结构如下：user_id:
Android 实现照片抠出人像。 No Promises﹉ android
谢谢阅览、关注！！一、各平台的实现方式：1.Android实现方式：使用图像处理库（如OpenCV）：集成OpenCV库，利用其图像处理功能进行边缘检测和图像分割；使用机器学习模型（如TensorFlowLite）：集成TensorFlowLite和预训练的人像分割模型；使用第三方API服务：利用如百度AI、腾讯AI等提供的在线API进行图像处理。步骤：集成必要的库或API、加载和处理图像、应用抠
无法向会话状态服务器发出会话状态请求。请确保 ASP.NET State Service (ASP.NET 状态服务)已启动，并且客户端端口与服务器端口相同。如果服务器位于远程计算机上，请检查 ... Allen_f58e
无法向会话状态服务器发出会话状态请求。请确保ASP.NETStateService(ASP.NET状态服务)已启动，并且客户端端口与服务器端口相同。如果服务器位于远程计算机上，请检查HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\aspnet_state\Parameters\AllowRemoteConnection的值，确保服务器接受远
后量子签名：Hash-and-Sign（上篇）山登绝顶我为峰 3(^v^)3 #后量子密码学哈希算法算法密码学机器学习零知识证明
参考文献：[CT65]CooleyJW,TukeyJW.AnalgorithmforthemachinecalculationofcomplexFourierseries[J].Mathematicsofcomputation,1965,19(90):297-301[Babai86]BabaiL.OnLovász’latticereductionandthenearestlatticepointp
Python机器学习笔记：CART算法实战战争热诚
完整代码及其数据，请移步小编的GitHub传送门：请点击我如果点击有误：https://github.com/LeBron-Jian/MachineLearningNote前言在python机器学习笔记：深入学习决策树算法原理一文中我们提到了决策树里的ID3算法，C4.5算法，并且大概的了
机器学习是什么三花学编程机器学习
机器学习是什么？机器学习，这一词汇在当今的科技领域中可谓炙手可热，其影响深远，不仅改变了科学研究的方式，也推动了社会的快速发展。那么，机器学习到底是什么呢？机器学习，顾名思义，是机器（通常指计算机）进行学习的过程。这个过程模仿了人类的学习方式，通过经验积累，不断优化自身性能，最终能够在没有人类直接干预的情况下，进行决策或预测。简单来说，机器学习就是让计算机具备从数据中学习并自动改进的能力。机器学习
Mac 配置环境变量和处理路径中空格 lsq126yx macos python 开发语言
在终端中设置临时环境变量，使用export命令可以在当前的终端会话中设置临时环境变量。例如，要设置JAVA_HOME环境变量，可以执行以下命令：exportJAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_201.jdk/Contents/Home这样在当前终端会话中，JAVA_HOME环境变量就被设置为指定的路径了。在用户目录下设置永久环境
最新ChatGPT支持下的PyTorch机器学习与深度学习 zkzhzy ChatGPT 机器学习 python 机器学习深度学习 pytorch chatgpt 数据分析人工智能
近年来，随着AlphaGo、无人驾驶汽车、医学影像智慧辅助诊疗、ImageNet竞赛等热点事件的发生，人工智能迎来了新一轮的发展浪潮。尤其是深度学习技术，在许多行业都取得了颠覆性的成果。另外，近年来，Pytorch深度学习框架受到越来越多科研人员的关注和喜爱。郁磊（副教授）主要从事AI人工智能、大语言模型及软件开发、生理系统建模与仿真、生物医学信号处理，具有丰富的科研经验，主编《MATLAB智能算
神奇的微积分科学的N次方人工智能人工智能 ai
微积分在人工智能（AI）领域扮演着至关重要的角色，以下是其主要作用：优化算法：•梯度下降法：微积分中的导数被用来计算损失函数相对于模型参数的梯度，这是许多机器学习和深度学习优化算法的核心。梯度指出了函数值增加最快的方向，通过沿着负梯度方向更新权重，可以最小化损失函数并优化模型。•反向传播：在神经网络训练中，微积分的链式法则用于计算整个网络中每个参数对于最终损失函数的影响（偏导数），这一过程就是反向
机器学习简介 Dayueban
@我的博客：有味写在前面在年前将要进行靶向代谢组学测定的样品送去公司，随之想想，还有一个半月的时间数据才会回来，那么这段时间是不是可以先学习下分类数据如何分析呢（PS:因为数据是属于分类性质的），所以不久前买的一本书——《机器学习与R语言》稍微系统学一遍，该书为美国的BrettLantz所著，翻译工作由我国学者李洪成、许金炜、李舰完成。学习本书的主要目的是了解机器学习的思想，以及所应用的领域，当然
regression机器学习回归预测模型参考学习后自我总结饮啦冰美式机器学习回归学习
简单来说，就是将样本的特征矩阵映射到样本标签空间。回归分析帮助我们理解在改变一个或多个自变量时，因变量的数值会如何变化。线性模型线性回归用于建立因变量和一个或多个自变量之间的线性关系模型。在线性回归中，假设因变量（被预测变量）与自变量（预测变量）之间存在着线性关系，也就是说，因变量的数值可以通过自变量的线性组合来预测。普通最小二乘线性回归。通过最小化实际观测值与模型预测值之间的误差平方和，可以找到
JVM，GC算法，垃圾回收器，类加载器，进行线上JVM性能调优。刘小董学习心得 JAVA JVM jvm
JVM（JavaVirtualMachine，Java虚拟机）是Java程序的运行环境，它在操作系统上提供了一个抽象层，使得Java程序可以独立于硬件平台运行。JVM有自己的指令集和内存管理机制，它负责将Java字节码转换为机器码并执行。垃圾回收（GarbageCollection，GC）是JVM的一个重要特性，它负责自动回收不再使用的内存。GC的目标是尽可能地回收垃圾对象，以释放内存空间，并确保
二十二、elasticSearch的most-fields策略书写只为分享
1、most-fields策略best-fields策略，主要是说将某一个field匹配尽可能多的关键词的doc优先返回回来most-fields策略，主要是说尽可能返回更多field匹配到某个关键词的doc，优先返回回来，用法和上面的一样当我们相查找与learningcourses相关的数据时如果数据如下：{"update":{"_id":"1"}}{"doc":{"sub_title":"le
线性回归和逻辑回归对比学习-含代码和数据 M.D 线性回归逻辑回归学习
线性回归和逻辑回归是两种常见的机器学习算法，它们在一些方面相似，但在其他方面则有明显的不同。以下是它们的对比以及您提供的代码示例：线性回归(LinearRegression)线性回归用于预测连续的数值。这种模型假设自变量和因变量之间存在线性关系。fromsklearn.linear_modelimportLinearRegressionimportmatplotlib.pyplotaspltimp
【Conda】详细讲解程序员不想敲代码啊 conda
Conda1.前言2.关键特点3.Conda命令1.前言Conda是一个流行的包管理器和环境管理器，主要用于Python编程语言，但也可以用来安装、运行和更新包和环境中的任何语言，如R、Ruby、Lua、Scala、Java等。Conda主要是为了方便数据科学、机器学习和类似应用的需要而设计的，但它对任何类型的软件都是适用的。下面，我将概述Conda的几个关键特点和常用命令：2.关键特点环境管理：
机器学习常用框架碧落&凡尘机器学习人工智能
机器学习是人工智能的一个重要分支，它通过让计算机系统利用数据自我学习来改进任务执行的能力。在机器学习领域，有许多成熟的框架被广泛使用，这些框架提供了构建和训练机器学习模型的工具。以下是一些常用的机器学习框架：TensorFlow：由Google开发，是一个开源的软件库，用于数据流编程，广泛应用于各类机器学习任务。它支持分布式计算，能够在大规模数据集上训练复杂的模型。PyTorch：由Faceboo
TensorFlow的介绍和简单案例科学的N次方人工智能 tensorflow 人工智能 python
TensorFlow是一个开源的机器学习框架，由Google开发和维护。它旨在使构建和训练机器学习模型变得更加容易，同时提供高度灵活性和可扩展性。TensorFlow基于数据流图的概念。数据流图是一个由节点和边组成的有向图，其中节点表示操作，边表示数据的流动。TensorFlow通过在数据流图中定义操作和变量来表示机器学习模型，并使用图的计算能力进行训练和推理。TensorFlow支持多种机器学习
DeePhage：预测噬菌体的生活方式 CAAS_IFR_zp 生活
GitHub-shufangwu/DeePhage:Atoolfordistinguishtemperatephage-derivedandvirulentphage-derivedsequenceinmetaviromedatausingdeeplearning安装condacreate-ndeephagecondaactivatedeephagepipinstallnumpypipinstal
JVM（Java虚拟机）概述龙大. JVM Java jvm java 开发语言
1.JVM的定义和作用JVM（JavaVirtualMachine）是一个能够运行Java字节码的虚拟计算机。它是Java平台的核心组成部分，负责执行编译后的Java程序，提供跨平台运行的能力。JVM使得Java程序可以在任何安装了JVM的操作系统上运行，无需对代码进行修改，实现了"一次编写，到处运行"（WriteOnce,RunAnywhere）的理念。2.JVM架构组件JVM主要由以下几个核心
基于Python和OpenCV的产品码识别与验证案例 GT开发算法工程师 python opencv 开发语言人工智能计算机视觉
引言：本案例展示了如何使用Python结合OpenCV库来实现产品码的识别与验证。首先，通过图像预处理技术（如灰度化、二值化、降噪等）优化产品码图像，然后利用OpenCV中的模板匹配或机器学习算法（如SVM、神经网络等）来定位并识别产品码。目录原理：代码部分：注意：原理：产品码识别与验证的核心在于图像处理与模式识别技术。首先，通过图像处理技术提取出产品码区域，去除背景干扰，增强产品码的可识别性。然
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它

【机器学习】西瓜书 03 线性回归模型

03 线性模型

文章目录

机器学习三要素

3.1 一元线性回归算法原理

3.1.1最小二乘法

3.1.2极大似然估计法

3.2 参数估计

凸集

凸函数

凸充分性定理

梯度

Hessian矩阵

3.2.1证明 E ( w , b ) E_{(w,b)} E(w,b)​是关于 w w w和 b b b的凸函数

3.2.2求解损失函数的参数

3.2.3向量化

3.2.4 多元线性回归

3.2.5 矩阵微分

3.2.6 对数线性回归

3.3 Logistic 回归 （解决分类问题）

3.3.1 联系函数

3.3.2 参数估计

3.3.2.1 极大似然估计

3.3.2.2 信息熵

自信息

信息熵

相对熵（KL散度）

3.4 线性判别分析

广义特征值

广义瑞利商

你可能感兴趣的:(Machine,Learning,机器学习,线性回归)

3.2.1证明 $E_{(w,b)}$ 是关于 $w$ 和 $b$ 的凸函数

3.3 Logistic 回归（解决分类问题）