顧辰

BP神经网络（Back Propagation Neural Network）Matlab简单实现

前言
数据准备
前向传播（FeedForward Propagation）
反向传播（Backward Propagation）/ 误差逆传播

（一）：求解损失/误差相对于每个神经元的梯度
（二）：求解损失/误差相对于每个权值的梯度
（三）：使用梯度下降对权值进行更新

动态可视化效果
代码实现

前言

前一篇：单层感知机（Single Layer Perceptron）原理及Matlab实现，我们介绍了单层感知机，我们知道，它只能解决线性可分数据。对于下图的数据(左为两个同心圆构成的数据，右为异或问题)，它将一直迭代且无法收敛。

对于以上两类数据，我们可以通过特征映射，将数据从低维空间映射到高维空间中（例如核函数），使得低维线性不可分问题转化为高维线性可分问题，从而将正负样本分开。如下图(图2来自西瓜书)：
我们也可以通过BP神经网络解决这一问题。为了方便大家理解，我们在下文一步一步展开。

数据准备

如果我们的样本输入为四个二维空间的样本集合：
$\begin{bmatrix} x_1 \\ x_2 \end{bmatrix} = \begin{bmatrix} x_{1,1} & x_{1,2} & x_{1,3} & x_{1,4} \\ x_{2,1} & x_{2,2} & x_{2,3} & x_{2,4} \end{bmatrix}_{2\times4} = \begin{bmatrix} 0 & 0 & 1 & 1 \\ 0 & 1 & 0 & 1 \end{bmatrix}_{2\times4}$ 所属的类标签
$\begin{bmatrix} 1 & 0 & 1& 0 \end{bmatrix}_{1\times4}$

我们知道单层感知机无法解决上述经典异或问题，接下来我们叠加多层网络，如下图：
其中

◍为输入层， $=\begin{bmatrix} x_1 & x_2 & x_3 & x_4\end{bmatrix}$
◍为隐藏层，为输入层的加权和， $\bar h = w^Tx + b$
◍为经过激活函数的输出，h = $\sigma[\bar h]$ 。这里的激活函数 $\sigma$ 为非线性函数。通常本层隶属于隐藏层且无需绘制，本文画法仅为了后续推导的直观性
◍为输出层，我们的类别为{0, 1}，所以这里面我们使用两个(=类别数)神经元作为预测。这一层我们将激活函数◍也整合进来，即 $\hat y =\sigma[\bar y]= \sigma[w^Th+b]$ 。

为什么我们的激活函数为非线性的？我们可以想象如果激活函数为线性函数时，那么无论经过多少层，神经网络也只是将输入线性组合后再输出：
$\hat y = w_n^T(\cdots (w_2^T(w_1^Tx+b_1)+b_2)+\cdots)+b_n = w^Tx+b$ 这就等效于一个线性函数来代替，到头来变成了线性回归模型，隐藏层的作用也就消失了。

而对于非线性的激活函数的作用，可以看作：

通过激活函数的非线性映射，将原本处于线性空间数据映射到非线性空间，再经过特征组合，从而形成非线性决策边界，从而逼近复杂函数。
通过激活函数，将输出压缩到特定区间内：(0, 1), (-1,1), …

如何设置神经元数和隐藏层数？
来自Andrew Ng课程：

输入层 ◍：神经元数=特征维度。
隐藏层 ◍：默认一个。如果选用多个最好保持数目相同，且隐藏层越多，分类效果越好，相应的计算量越大。
输出层 ◍：神经元数=类别数。

前向传播（FeedForward Propagation）

下面我们将通过前向传播算法来求解预测值。
首先求解隐藏层的值： $h=w^Tx+b$ 。我们可以将偏置（bias）看成值为1，连接权值 $w_b$ 的神经元上图没添加。那么相当于扩充矩阵 $[x]$ ：
$\begin{bmatrix} 1 \\ x_1 \\ x_2 \end{bmatrix} = \begin{bmatrix} 1&1& 1&1 \\ x_{1,1} & x_{1,2} & x_{1,3} & x_{1,4} \\ x_{2,1} & x_{2,2} & x_{2,3} & x_{2,4} \end{bmatrix}_{3\times4} = \begin{bmatrix} 1&1& 1&1 \\ 0 & 0 & 1 & 1 \\ 0 & 1 & 0 & 1 \end{bmatrix}_{3\times4}$ 对于 $[x]$ 的权值 $w_1$ ,可以写成：
$\begin{bmatrix} w_{1,1} & w_{1,2} & w_{1,3} & w_{1,4} & w_{1,5} \\ w_{2,1} & w_{2,2} & w_{2,3} & w_{2,4} & w_{2,5} \\ w_{3,1} & w_{3,2} & w_{3,3} & w_{3,4} & w_{3,5} \\ \end{bmatrix}_{3\times5}$ 于是隐藏层的输入 $[\bar h]$ 可以写成：
$\begin{aligned} [\bar h] = w^T x&= \begin{bmatrix} w_{1,1}1 +w_{2,1}x_{1,1}+w_{3,1}x_{2,1} &w_{1,1}1 +w_{2,1}x_{1,2}+w_{3,1}x_{2,2} & w_{1,1}1 +w_{2,1}x_{1,3}+w_{3,1}x_{2,3} &w_{1,1}1 +w_{2,1}x_{1,4}+w_{3,1}x_{2,4} \\ w_{1,2}1 +w_{2,2}x_{1,1}+w_{3,2}x_{2,1} & w_{1,2}1 +w_{2,2}x_{1,2}+w_{3,2}x_{2,2} & w_{1,2}1 +w_{2,2}x_{1,3}+w_{3,2}x_{2,3} & w_{1,2}1 +w_{2,2}x_{1,4}+w_{3,2}x_{2,4} \\ w_{1,3}1 +w_{2,3}x_{1,1}+w_{3,3}x_{2,1} & w_{1,3}1 +w_{2,3}x_{1,2}+w_{3,3}x_{2,2} & w_{1,3}1 +w_{2,3}x_{1,3}+w_{3,3}x_{2,3} & w_{1,3}1 +w_{2,3}x_{1,4}+w_{3,3}x_{2,4} \\ w_{1,4}1 +w_{2,4}x_{1,1}+w_{3,4}x_{2,1} & w_{1,4}1 +w_{2,4}x_{1,2}+w_{3,4}x_{2,2} & w_{1,4}1 +w_{2,4}x_{1,3}+w_{3,4}x_{2,3} & w_{1,4}1 +w_{2,4}x_{1,4}+w_{3,4}x_{2,4} \\ w_{1,5}1 +w_{2,5}x_{1,1}+w_{3,5}x_{2,1} & w_{1,5}1 +w_{2,5}x_{1,2}+w_{3,5}x_{2,2} & w_{1,5}1 +w_{2,5}x_{1,3}+w_{3,5}x_{2,3} & w_{1,5}1 +w_{2,5}x_{1,4}+w_{3,5}x_{2,4} \\\end{bmatrix}_{5\times4} \\ &= \begin{bmatrix} \bar h_1 \\\bar h_2 \\\bar h_3 \\\bar h_4 \\\bar h_5 \end{bmatrix}= \begin{bmatrix} \bar h_{1,1} &\bar h_{1,2} & \bar h_{1,3} & \bar h_{1,4} \\\bar h_{2,1} & \bar h_{2,2} & \bar h_{2,3} & \bar h_{2,4} \\\bar h_{3,1} & \bar h_{3,2} & \bar h_{3,3} & \bar h_{2,4} \\\bar h_{4,1} & \bar h_{4,2} & \bar h_{4,3} & \bar h_{4,4} \\\bar h_{5,1} & \bar h_{5,2} & \bar h_{5,3} & \bar h_{5,4} \end{bmatrix}_{5\times4} \end{aligned}$ 经过激活函数（这里先选缺点较多的sigmoid： $\sigma(x) = \frac{1}{1+e^{-x}}$ ），变成 $h$ 作为隐藏层的输出)：
$[\sigma(\bar h)] = \begin{bmatrix} \sigma(\bar h_1) \\\sigma(\bar h_2) \\\sigma(\bar h_3) \\\sigma(\bar h_4) \\\sigma(\bar h_5) \end{bmatrix}= \begin{bmatrix} \sigma(\bar h_{1,1}) & \sigma(\bar h_{1,2}) & \sigma(\bar h_{1,3}) & \sigma(\bar h_{1,4}) \\\sigma(\bar h_{2,1}) & \sigma(\bar h_{2,2}) & \sigma(\bar h_{2,3}) & \sigma(\bar h_{2,4}) \\\sigma(\bar h_{3,1}) & \sigma(\bar h_{3,2}) & \sigma(\bar h_{3,3}) & \sigma(\bar h_{2,4}) \\\sigma( \bar h_{4,1}) & \sigma(\bar h_{4,2}) & \sigma(\bar h_{4,3}) &\sigma(\bar h_{4,4}) \\\sigma( \bar h_{5,1}) & \sigma(\bar h_{5,2}) & \sigma(\bar h_{5,3}) & \sigma(\bar h_{5,4}) \end{bmatrix}_{5\times4}$

同样，像第一步扩充矩阵 $[h]$ ，得到
$[\sigma(h)] = \begin{bmatrix} 1\\ \sigma(h_1) \\\sigma(h_2) \\\sigma(h_3) \\\sigma(h_4) \\\sigma(h_5) \end{bmatrix}= \begin{bmatrix} 1&1&1&1 \\ \sigma(h_{1,1}) & \sigma(h_{1,2}) & \sigma(h_{1,3}) & \sigma(h_{1,4}) \\\sigma(h_{2,1}) & \sigma(h_{2,2}) & \sigma(h_{2,3}) & \sigma(h_{2,4}) \\\sigma(h_{3,1}) & \sigma(h_{3,2}) & \sigma(h_{3,3}) & \sigma(h_{2,4}) \\\sigma( h_{4,1}) & \sigma(h_{4,2}) & \sigma(h_{4,3}) &\sigma(h_{4,4}) \\\sigma( h_{5,1}) & \sigma(h_{5,2}) & \sigma(h_{5,3}) & \sigma(h_{5,4}) \end{bmatrix}_{6\times4}$
继续前向传播，一般来说输出层节点数与分类的类别数相等。因为我们这里是二分类，所以使用两个节点。这里设置新权值w为：
$\begin{bmatrix} w_{1,1} & w_{1,2} \\ w_{2,1} & w_{2,2} \\ w_{3,1} & w_{3,2} \\ w_{4,1} & w_{4,2} \\ w_{5,1} & w_{5,2}\\ w_{6,1} & w_{6,2}\\ \end{bmatrix}_{6\times2}$

生成预测标签 $\hat y$ ，这里我们就不展开了：
$[\hat y] = \sigma[\bar y] = \sigma[w^T [\sigma(h)]] = \begin{bmatrix} \hat y_{1,1} & \hat y_{1,2} & \hat y_{1,3} & \hat y_{1,4}\\ \hat y_{2,1} & \hat y_{2,2} & \hat y_{2,3} & \hat y_{2,4} \end{bmatrix}_{2\times4}$
在这里我们使用二值交叉熵（Cross Entropy Loss）损失函数来作为损失函数：
$L_{cross\_entropy} = -\frac{1}{n}\sum_{i=1}^n[ y_i \log \hat y_i +(1- y_i) \log (1-\hat y_i)]$
其中样本数 $n=4，y_i$ 为数据的真实标签。
$\begin{aligned} &L_{cross\_entropy} = - \frac{1}{4} \sum_{col} \sum_{row} (\begin{bmatrix} \hat y_{1,1}\log y_{1,1} & \hat y_{1,2}\log y_{1,2} & \hat y_{1,3}\log y_{1,3} & \hat y_{1,4}\log y_{1,4}\\ \hat y_{2,1}\log y_{2,1} & \hat y_{2,2}\log y_{2,2} & \hat y_{2,3}\log y_{2,3} & \hat y_{2,4}\log y_{2,4} \end{bmatrix} \\+ &\begin{bmatrix} (1-\hat y_{1,1})\log (1-y_{1,1}) & (1-\hat y_{1,2})\log (1-y_{1,2}) & (1-\hat y_{1,3})\log (1-y_{1,3}) & (1-\hat y_{1,4})\log(1- y_{1,4})\\ (1-\hat y_{2,1})\log (1-y_{2,1}) & (1-\hat y_{2,2})\log (1-y_{2,2}) & (1-\hat y_{2,3})\log (1-y_{2,3}) & (1-\hat y_{2,4})\log (1-y_{2,4}) \end{bmatrix}) \end{aligned}$

所以前向传播可以看成，神经网络从第一层开始，层层向前计算并传播的过程。多层级联的神经网络结合激活函数（非线性的激活函数可以使得决策面不再为直线），使得神经网络具有解决非线性可分数据的能力。

反向传播（Backward Propagation）/ 误差逆传播

（一）：求解损失/误差相对于每个神经元的梯度

对于反向传播，我们可以看成将最后损失函数的梯度层层传递给前面层，通过计算图模型（Computational Graph）来将误差层层回溯，关于计算图很多讲解都很明确cs231n、李宏毅老师的ML课程，这里就不说了，主要就是偏微分链式求导法则chain rule性质，下文中也有体现。
已知交叉熵损失函数为：
$L_{cross\_entropy} = -\frac{1}{n}\sum_{i=1}^n[ y_i \log \hat y_i +(1- y_i) \log (1-\hat y_i)]$

我们先求交叉熵损失关于输出层中的输入 $\bar y_i$ 的梯度：
$\begin{aligned} \frac{\partial L}{\partial \hat y_i} &= -( \frac{y_i}{ \hat y_i} -\frac{1- y_i} {1-\hat y_i}) \\ \frac{\partial \hat y_i}{\partial \bar y_i} &= \frac{\partial \frac{1}{1+e^{-\bar y_i}}}{\partial \bar y_i} = \frac{-e^{-\bar y_i}}{(1-e^{-\bar y_i})^2} = \hat y_i(1-\hat y_i) \\ \frac{\partial L}{\partial \bar y_i} &=\frac{\partial L}{\partial \hat y_i}\cdot \frac{\partial \hat y_i}{\partial \bar y_i} = -[ \frac{y_i}{ \hat y_i} -\frac{1- y_i} {1-\hat y_i}] \hat y_i(1-\hat y_i)\\ &=-y_i(1-\hat y_i)+(1-y_i)\hat y_i\\ &=\hat y_i - y_i \end{aligned}$

输出层-隐藏层，隐藏层-输入层中的神经元间O - Out, I - In关系可以写为
$\sigma[w^TI]$
于是求损失关于神经元的梯度可以写成其中L/∂O已知：
$L_{◍} = \frac {\partial O}{\partial I} \odot \frac{L}{\partial O}= w\cdot( O\odot(1-O) \odot \frac{L}{\partial O})$
以上述隐藏层的输出◍和输入层◍为例，这里 $h$ 指代反向传播的梯度：

$\begin{aligned} h &= \begin{bmatrix} h_1 \\h_2 \\h_3 \\h_4 \\h_5 \end{bmatrix}， h\odot(1-h^T) = \begin{bmatrix} h_1(1-h_1) \\ h_2(1-h_2) \\ h_3(1-h_3) \\ h_4(1-h_4) \\ h_5(1-h_5) \end{bmatrix}\\ L_{◍} &= \begin{bmatrix} L_{◍^1}\\ L_{◍^2} \end{bmatrix}= w\cdot (h^T\odot(1-h^T) \odot \frac{L}{\partial h}) \\&= \begin{bmatrix} w_{2,1} & w_{2,2} & w_{2,3} & w_{2,4} & w_{2,5} \\ w_{3,1} & w_{3,2} & w_{3,3} & w_{3,4} & w_{3,5} \\ \end{bmatrix}_{2\times5}\cdot( \begin{bmatrix} h_1(1-h_1) \\ h_2(1-h_2) \\ h_3(1-h_3) \\ h_4(1-h_4) \\ h_5(1-h_5) \end{bmatrix}_{5\times1}\odot \frac{L}{\partial h}) \end{aligned}$
我们可以观察神经元间的连接线（蓝线、紫线、黑线）来验证为什么这里是点乘和叉乘。
由上步我们很容易得到L_◍和L_◍的梯度公式。

对于以上梯度的链式求导，我们可以使用雅可比矩阵(Jacobian Matrix)求解：
$\begin{bmatrix} \frac {\partial y_1}{\partial x_1} & \frac {\partial y_1}{\partial x_2} & \cdots &\frac{\partial y_1}{\partial x_n} \\ \frac {\partial y_2}{\partial x_1} & \frac {\partial y_2}{\partial x_2} & \cdots &\frac{\partial y_2}{\partial x_n} \\ \vdots & \vdots & \ddots & \vdots\\ \frac {\partial y_m}{\partial x_1} & \frac {\partial y_m}{\partial x_2} & \cdots &\frac{\partial y_m}{\partial x_n} \end{bmatrix} = \begin{bmatrix} \frac {\partial y_1}{\partial g_1} & \frac {\partial y_1}{\partial g_2} & \cdots &\frac{\partial y_1}{\partial g_i} \\ \frac {\partial y_2}{\partial g_1} & \frac {\partial y_2}{\partial g_2} & \cdots &\frac{\partial y_2}{\partial g_i} \\ \vdots & \vdots & \ddots & \vdots\\ \frac {\partial y_m}{\partial g_1} & \frac {\partial y_m}{\partial g_2} & \cdots &\frac{\partial y_m}{\partial g_i} \end{bmatrix} \begin{bmatrix} \frac {\partial g_1}{\partial x_1} & \frac {\partial g_1}{\partial x_2} & \cdots &\frac{\partial g_1}{\partial x_n} \\ \frac {\partial g_2}{\partial x_1} & \frac {\partial g_2}{\partial x_2} & \cdots &\frac{\partial g_2}{\partial x_n} \\ \vdots & \vdots & \ddots & \vdots\\ \frac {\partial g_i}{\partial x_1} & \frac {\partial g_i}{\partial x_2} & \cdots &\frac{\partial g_i}{\partial x_n} \end{bmatrix}$

（二）：求解损失/误差相对于每个权值的梯度

我们已经求出来损失函数关于每个神经元的梯度L_◍和L_◍，下一步就是求损失函数关于权值 $w$ 的梯度，以便对权值进行更新。
因为权值和下一层神经元的关系可以表示为
$L_◍ = w^Tx$

所以损失函数对于权值 $w$ 的梯度可以由上一层的神经元传递下来，对上述求导可得：
$\frac {\partial L_◍}{w} = x$
我们以输入层为例
$\begin{aligned} [\frac{\partial L}{\partial w}] &= \begin{bmatrix} \frac{\partial L}{\partial w_{1,1}} & \frac{\partial L}{\partial w_{1,2}} & \frac{\partial L}{\partial w_{1,3}} & \frac{\partial L}{\partial w_{1,4}} & \frac{\partial L}{\partial w_{1,5}} \\ \frac{\partial L}{\partial w_{2,1}} & \frac{\partial L}{\partial w_{2,2}} & \frac{\partial L}{\partial w_{2,3}} & \frac{\partial L}{\partial w_{1,4}} & \frac{\partial L}{\partial w_{2,5}} \\ \frac{\partial L}{\partial w_{3,1}} & \frac{\partial L}{\partial w_{3,2}} & \frac{\partial L}{\partial w_{3,3}} & \frac{\partial L}{\partial w_{3,4}} & \frac{\partial L}{\partial w_{3,5}} \\ \end{bmatrix}_{3\times5}\\ &=\begin{bmatrix} \frac{\partial L}{\partial \bar h_1} \cdot 1& \frac{\partial L}{\partial \bar h_1}\cdot 1 & \frac{\partial L}{\partial \bar h_1}\cdot 1 & \frac{\partial L}{\partial \bar h_1} \cdot 1& \frac{\partial L}{\partial \bar h_1} \cdot 1\\ \frac{\partial L}{\partial \bar h_2} \cdot x_1& \frac{\partial L}{\partial \bar h_2}\cdot x_1 & \frac{\partial L}{\partial \bar h_2}\cdot x_1 & \frac{\partial L}{\partial \bar h_2} \cdot x_1& \frac{\partial L}{\partial \bar h_2} \cdot x_1\\ \frac{\partial L}{\partial \bar h_3} \cdot x_3& \frac{\partial L}{\partial \bar h_3}\cdot x_3 & \frac{\partial L}{\partial \bar h_3}\cdot x_3 & \frac{\partial L}{\partial \bar h_3} \cdot x_3& \frac{\partial L}{\partial \bar h_3} \cdot x_3\\ \end{bmatrix}_{3\times5}\\ & \end{aligned}$

到此权值的梯度已经获得，接下来就是梯度下降来进行迭代求解。

（三）：使用梯度下降对权值进行更新

梯度下降（二）
梯度下降（二）

这里就不细说了，本文采用Adam+小批梯度下降进行梯度下降。

动态可视化效果

下面是使用Sigmoid作为激活函数对异或数据分类的结果（1）：
下面是使用Sigmoid作为激活函数对同心圆数据分类的结果（2）：

下面是使用ReLU作为激活函数对异或数据分类的结果：
下面是使用Sigmoid作为激活函数对同心圆数据分类的结果：

下面是使用ReLU作为激活函数对同心圆数据分类的结果：
把输入经过多层的传递以及非线性变换后的输出画出来，如下：
可以看到，数据变成线性可分了。

代码实现

本代码参考voidbip ，修改了梯度下降及权值初始化部分，以及增加了ReLU模块，并在其他地方有一定的更改：

% Reference : https://github.com/voidbip/matlab_nn 

clc;clear;clf;
X = [0 0 1 1; 0 1 0 1];             % x -> Data set 2-dimension data
flag = [0 1 1 0];                   % y -> Flag / label

n = 100;                                        % The first and second data sets
a = linspace(0,2*pi,n/2);                       % Set the values for x
u = [5*cos(a)+5 10*cos(a)+5]+1*rand(1,n);
v = [5*sin(a)+5 10*sin(a)+5]+1*rand(1,n);
X = [u;v];
flag = [zeros(1,n/2),ones(1,n/2)];



classNum = length(unique(flag));    % How many classes?
[row, col] = size(X);               % row -> dimension, col -> size of dataset
NNLayer = [row 20 classNum];        % The structure of our neuron networks

% [1] Initialize weights randomly
w = randInitWeights(NNLayer);       

iteration = 10000;              % Set our iterations
acMethod = 'SIGMOID';              % Set our activation functions


lambda = 0;
flagMatrix = zeros(classNum,col);

for i = 1 : length(flag)
    flagMatrix(flag(i)+1,i) = 1;
end

% - Mini-Batch Gradient Descent Params - %
batchSize = 4;
% - Adam Params - %
eta = 0.002;    % Learning rate
s = 0; beta = 0.99; momentum = 0; gamma = 0.9; cnt = 0;

%- draw -%
Range = [-10, 20; -10, 20];     % set the range of dataset
figure(1);
hold on;
posFlag = find(flag == 1);
negFlag = find(flag == 0);
plot(X(1,posFlag), X(2,posFlag), 'r+','linewidth',2);
plot(X(1,negFlag), X(2,negFlag), 'bo','linewidth',2);
[h_region1,h_region2] = drawRegion(Range,w,NNLayer,acMethod);

for i = 1 : iteration 
%     %i
%     cnt = cnt+1;
   if(mod(i,100)==0)
        delete(h_region1);delete(h_region2);
        wFinal = w;
        [h_region1,h_region2] = drawRegion(Range,wFinal,NNLayer,acMethod);
        title('Data Fitting Using Neuron Networks');
        legend('class 1','class 2','seprated region');
        xlabel('x');
        ylabel('y')
        drawnow;
    
   end
  
%    Mini-batch gradient descent + Adam 懒得写成函数了
   dataSize = length(X);           % obtain the number of data 
   k = fix(dataSize/batchSize);    % obtain the number of batch which has absolutely same size: k = batchNum-1;    
   batchIdx = randperm(dataSize);  % randomly sort for every epoch for achiving sample diversity

   flagBatch = flagMatrix(:,batchIdx(1:batchSize));
   batchIdx1 = reshape(batchIdx(1:k*batchSize),k,batchSize);   % batches which has absolutely same size
   batchIdx2 = batchIdx(k*batchSize+1:end);                    % ramained batch
    
   for batchIdx = 1 : k
       valMatrix = ForwardPropagation(X(:,batchIdx1(batchIdx,:)),w,NNLayer,acMethod);
       [j,jw]    = BackwardPropagation(flagMatrix(:,batchIdx1(batchIdx,:)), valMatrix, w, lambda, NNLayer, acMethod);
       cnt = cnt+1;
       if j<0.01
          break;
       end

       [sizeW,~] = size(jw);  
       eps = 10^-8*ones(sizeW,1);

       s = beta*s + (1-beta)*jw.*jw;                    % Update s
       momentum = gamma*momentum + (1-gamma).*jw;       % Update momentum
       momentum_bar = momentum/(1-gamma^cnt);
       s_bar = s /(1-beta^cnt);
       w = w - eta./sqrt(eps+s_bar).*momentum_bar;      % Update parameters(theta)
       
    end
    if(~isempty(batchIdx2))
        valMatrix = ForwardPropagation(X(:,batchIdx2),w,NNLayer,acMethod);
        [j,jw]    = BackwardPropagation(flagMatrix(:,batchIdx2), valMatrix, w, lambda, NNLayer, acMethod);
        cnt = cnt+1;
       %if j<0.01
       %    break;
       %end

       [sizeW,~] = size(jw);  
       eps = 10^-8*ones(sizeW,1);

        s = beta*s + (1-beta)*jw.*jw;                   % Update s
        momentum = gamma*momentum + (1-gamma).*jw;       % Update momentum
        momentum_bar = momentum/(1-gamma^cnt);
        s_bar = s /(1-beta^cnt);
        w = w - eta./sqrt(eps+s_bar).*momentum_bar;   % Update parameters(theta)
    end
   
   
   
   
%    Batch gradient descent   
%    valMatrix = ForwardPropagation(X,w,NNLayer,acMethod);
%    [j,jw]    = BackwardPropagation(flagMatrix, valMatrix, w, lambda, NNLayer, acMethod);
%    w = w-eta*jw;
%    j
%    if j<0.1
%        break;
%    end
   
end

hold off; 

%% Initialize Weights Randomly
% input: [2 10 2]
% layer1:  2 neurons + 1 bias.
% layer2: 10 neurons + 1 bias.
% layer3:  2 neurons.
function [w] = randInitWeights(NNLayer)
    Len = length(NNLayer);                              % Obtain the number of layers
    shiftLayer = [0 ones(1,Len-1)+NNLayer(1:Len-1)];    % shiftLayer = NNLayer + 1(bias)， shiftLayer >> 1。
    wCount = NNLayer.*shiftLayer;                       % The number of weights for previous layer <-> shiftLayer .* NNLayer

    w = zeros(sum(wCount),1);               % Initialize weight vector
    accWIdx = cumsum(wCount);               % The index of each layer for weight vector 
    
    for i = 2 : Len
        eps = sqrt(6)/sqrt(NNLayer(i) + shiftLayer(i));
        w(accWIdx(i-1)+1:accWIdx(i)) = eps*(2*rand(wCount(i),1) - 1);
    end

end

%% FeedForward Propagation
function [valMatrix] = ForwardPropagation(X, w, NNLayer,acMethod)

    [dim, num] = size(X);
    Len = length(NNLayer);                               % Obtain the number of layers
    shiftLayer = [0 ones(1,Len-1)+NNLayer(1:Len-1)];     % shiftLayer = NNLayer + 1(bias)， shiftLayer >> 1。
    accWIdx = NNLayer.*shiftLayer;                       % The number of weights for previous layer <-> shiftLayer .* NNLayer
    ws = cumsum(accWIdx);                                % The index of each layer for weight vector 
    accValIdx = [0 cumsum(NNLayer)];
    if(dim ~= NNLayer(1))
       error("dim of data != dim of input of NN"); 
    end
    
    valMatrix = zeros(sum(NNLayer),num);
    valMatrix(1:dim,:) = X;
    for i = 2: Len
        %curLayerW = reshape(w(ws(i-1)+1:ws(i)),NNLayer(i),shiftLayer(i))';
        curLayerW = reshape(w(ws(i-1)+1:ws(i)),shiftLayer(i),NNLayer(i));
        valMatrix(accValIdx(i)+1:accValIdx(i+1),:) = activateFunc(curLayerW'*[ones(1,num);valMatrix(accValIdx(i-1)+1:accValIdx(i),:)],acMethod);
    end
end

%% Backward Propagation
function [CELoss,jw] = BackwardPropagation(y, valMatrix, w, lambda, NNLayer, acMethod)

    Len = length(NNLayer);
    [~,num] = size(y);
    gradX = zeros(sum(NNLayer(2:end)),num);
    jw = zeros(length(w),1);

    % CrossEntropy to calculate loss
    % Output values: valMatrix(end-NNLayer(end)+1:end,:) 
    y_hat = valMatrix(end-NNLayer(end)+1:end,:) + 1e-7;

    % This is Cross Entropy Loss value
    CELoss = -sum(sum(y.*log(y_hat)+(1-y).*log(1-y_hat)))/num;
    CELoss = CELoss + ((lambda*sum(w.^2))/(2*num)); % Regularization term
    
    % Easy way for sigmoid function
    gradX(end-NNLayer(end)+1:end,:) = y_hat - y;        % Obtain the gradient of Cross Entropy / back to y_hat
    %gradCE = -(y./y_hat-(1-y)./(1-y_hat));
    %gradX(end-NNLayer(end)+1:end,:) = gradCE.*calculateGrad(y_hat,'Sigmoid');
    
    shiftLayer = [0 ones(1,Len-1)+NNLayer(1:Len-1)];    % shiftLayer = NNLayer + 1(bias)， shiftLayer >> 1。
    accWIdx = NNLayer.*shiftLayer;                      % The number of weights for previous layer <-> shiftLayer .* NNLayer
    ws = cumsum(accWIdx);                               % The index of each layer for weight vector 
    
    gradIdx = [0 cumsum(NNLayer(2:end))];               % Obtain the gradient for each neurons except which in the first layer 
    ai=[0 cumsum(NNLayer)];
    % -- Calculate the gradient of neurons -- %
    for i = Len:-1:3
        %curLayerW = reshape(w(ws(i-1)+1: ws(i),:),NNLayer(i), shiftLayer(i))';       % Obtain weights between current adjacent layers
        curLayerW = reshape(w(ws(i-1)+1: ws(i),:), shiftLayer(i),NNLayer(i));       % Obtain weights between current adjacent layers
        curLayerW4X = curLayerW(2:end,:);                                           % Remove the gradients of biases
        gradBack = gradX(gradIdx(i-1)+1:gradIdx(i),:);                              % Get gradients from the next layer
        %gradSigmoid = calculateGrad(valMatrix(ai(i-1)+1:ai(i),:),acMethod);
        %gradX(gradIdx(i-2)+1:gradIdx(i-1),:) =  curLayerW4X*gradBack.*gradSigmoid;  % Calculate the gradient of neurons in current layer. 
        gradActiveFunc = calculateGrad(valMatrix(ai(i)+1:ai(i+1),:),acMethod);
        gradX(gradIdx(i-2)+1:gradIdx(i-1),:) =  curLayerW4X*(gradActiveFunc.*gradBack);  % Calculate the gradient of neurons in current layer. 
    
    end
    
    % -- Calculate the gradient for weights -- %

    for i = Len:-1:2
        temp = zeros(accWIdx(i),num);
        for cnt = 1:num
            %temp(:,cnt) = kron([1; valMatrix(ai(i-1)+1:ai(i),cnt)],gradX(gradIdx(i-1)+1:gradIdx(i),cnt));
            temp(:,cnt) = kron(gradX(gradIdx(i-1)+1:gradIdx(i),cnt),[1; valMatrix(ai(i-1)+1:ai(i),cnt)]);
        end
        jw(1+ws(i-1):ws(i))= sum(temp,2);

    end
    jw = jw/num;
    jw=jw + lambda*w/num;
end


function val = activateFunc(x,acMethod)
    switch acMethod        
        case {'SIGMOID','sigmoid'}
            val = 1.0./(1.0+exp(-x));
        case {'TANH','tanh'}
            val = tanh(x);
        case {'ReLU','relu'}
            val=max(0,x);      
        case {'tansig'}
            val=2/(1+exp(-2*x))-1
        otherwise
    end     
end


function val = calculateGrad(x,acMethod)
    switch acMethod        
        case {'SIGMOID','sigmoid'}
            val = (1-x).*x;
        case {'TANH','tanh'}
            error('...');   % TODO...
        case {'ReLU','relu'}
            val=x>0;
        case {'tansig'}
            error('...');   % TODO...
        otherwise
            error('...');   % TODO...
    end     
end



function [h_region1, h_region2] = drawRegion(Range,w,NNLayer,acMethod)
    % Draw region
    x_draw=Range(1):0.1:Range(3);
    y_draw=Range(2):0.1:Range(4);
    [meshX,meshY]=meshgrid(x_draw,y_draw);
    [row, col] = size(meshX); 
    classes = zeros(row,col);
    for i = 1:row
        valMatrix = ForwardPropagation([meshX(i,:); meshY(i,:)],w,NNLayer,acMethod);
        val = valMatrix(end,:)-valMatrix(end-1,:);
        classes(i,:) =(val>0)-(val<0); % class(pos) = 1, class(neg) = -1;
    end
    [row, col] = find(classes == 1);
    h_region1 = scatter(x_draw(col),y_draw(row),'MarkerFaceColor','r','MarkerEdgeColor','r');
    h_region1.MarkerFaceAlpha = 0.03;
    h_region1.MarkerEdgeAlpha = 0.03;
    
    [row, col] = find(classes == -1);
    h_region2 = scatter(x_draw(col),y_draw(row),'MarkerFaceColor','b','MarkerEdgeColor','b');
    h_region2.MarkerFaceAlpha = 0.03;
    h_region2.MarkerEdgeAlpha = 0.03;
end

日更006 终极训练营day3 懒cici
人生创业课（2）今天的主题：学习方法一：遇到有用的书，反复读，然后结合自身实际，列践行清单，不要再写读书笔记思考这本书与我有什么关系，我在哪些地方能用到，之后我该怎么用方法二：读完书没映像怎么办?训练你的大脑，方法：每读完一遍书，立马合上书，做一场分享，几分钟都行对自己的学习要求太低，要逼自己方法三：学习深度不够怎么办？找到细分领域的榜样，把他们的文章、书籍、产品都体验一遍，成为他们的超级用户，向
【花了N长时间读《过犹不及》，不断练习，可以越通透】君君Love
我已经记不清花了多长时间去读《过犹不及》，读书笔记都写了42页，这算是读得特别精细的了。是一本难得的好书，虽然书中很多内容和圣经吻合，我不是基督徒，却觉得这样的文字值得细细品味，和我们的生活息息相关。我是个界线建立不牢固的人，常常愧疚，常常害怕他人的愤怒，常常不懂拒绝，还有很多时候表达不了自己真实的感受，心里在说不嘴里却在说好……这本书给我很多的启示，让我学会了怎样去建立属于自己的清晰的界限。建立
基于redis的Zset实现作者的轻量级排名周童學 Java redis 数据库缓存
基于redis的Zset实现轻量级作者排名系统在今天的技术架构中，Redis是一种广泛使用的内存数据存储系统，尤其在需要高效检索和排序的场景中表现优异。在本篇博客中，我们将深入探讨如何使用Redis的有序集合（ZSet）构建一个高效的笔记排行榜系统，并提供相关代码示例和详细的解析。1.功能背景与需求假设我们有一个笔记分享平台，用户可以发布各种笔记，系统需要根据用户发布的笔记数量来生成一个实时更新的
常规笔记本和加固笔记本的区别 luchengtech 电脑三防笔记本加固计算机加固笔记本
在现代科技产品中，笔记本电脑因其便携性和功能性被广泛应用。根据使用场景和需求的不同，笔记本可分为常规笔记本和加固笔记本，二者在多个方面存在显著区别。适用场景是区分二者的重要标志。常规笔记本主要面向普通消费者和办公人群，适用于家庭娱乐、日常办公、学生学习等相对稳定的室内环境。比如，人们在家用它追剧、处理文档，学生在教室用它完成作业。而加固笔记本则专为特殊行业设计，像军事、野外勘探、工业制造、交通运输
第八课: 写作出版你最关心的出书流程和市场分析（无戒学堂复盘）人在陌上
今天是周六，恰是圣诞节。推掉了两个需要凑腿的牌局，在一个手机，一个笔记本，一台电脑，一杯热茶的陪伴下，一个人静静地回听无戒学堂的最后一堂课。感谢这一个月，让自己的习惯开始改变，至少，可以静坐一个下午而不觉得乏味枯燥难受了，要为自己点个赞。我深知，这最后一堂课的内容，以我的资质和毅力，可能永远都用不上。但很明显，无戒学堂是用了心的，毕竟，有很多优秀学员，已经具备了写作能力，马上就要用到这堂课的内容。
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
《感官品牌》读书笔记 1 西红柿阿达
原文:最近我在东京街头闲逛时，与一位女士擦肩而过，我发现她的香水味似曾相识。“哗”的一下，记亿和情感立刻像潮水般涌了出来。这个香水味把我带回了15年前上高中的时候，我的一位亲密好友也是用这款香水。一瞬间，我呆站在那里，东京的街景逐渐淡出，取而代之的是我年少时的丹麦以及喜悦、悲伤、恐惧、困惑的记忆。我被这熟悉的香水味征服了。感想:感官是有记忆的，你所听到，看到，闻到过的有代表性的事件都会在大脑中深深
我不想再当知识的搬运工楚煜楚尧
因为学校课题研究的需要，这个暑假我依然需要完成一本书的阅读笔记。我选的是管建刚老师的《习课堂十讲》。这本书，之前我读过，所以重读的时候，感到很亲切，摘抄起来更是非常得心应手。20页，40面，抄了十天，终于在今天大功告成了。这对之前什么事都要一拖再拖的我来说，是破天荒的改变。我发现至从认识小尘老师以后，我的确发生了很大的改变。遇到必须做却总是犹豫不去做的事，我学会了按照小尘老师说的那样，在心里默默数
20210517坚持分享53天读书摘抄笔记非暴力沟通——爱自己 f79a6556cb19
让生命之花绽放在赫布·加德纳（HerbGardner）编写的《一千个小丑》一剧中，主人公拒绝将他12岁的外甥交给儿童福利院。他郑重地说道：“我希望他准确无误地知道他是多么特殊的生命，要不，他在成长的过程中将会忽视这一点。我希望他保持清醒，并看到各种奇妙的可能。我希望他知道，一旦有机会，排除万难给世界一点触动是值得的。我还希望他知道为什么他是一个人，而不是一张椅子。”然而，一旦负面的自我评价使我们看
Unity学习笔记1 zy_777
通过一个星期的简单学习，初步了解了下unity，unity的使用，以及场景的布局，UI，以及用C#做一些简单的逻辑。好记性不如烂笔头，一些关键帧还是记起来比较好，哈哈，不然可能转瞬即逝了，（PS:纯小白观点，unity大神可以直接忽略了）一：MonoBehaviour类的初始化1，Instantiate()创建GameObject2，通过Awake()和Start()来做初始化3，Update、L
大数据技术笔记—spring入门卿卿老祖
篇一spring介绍spring.io官网快速开始Aop面向切面编程，可以任何位置，并且可以细致到方法上连接框架与框架Spring就是IOCAOP思想有效的组织中间层对象一般都是切入service层spring组成前后端分离已学方式，前后台未分离：Spring的远程通信：明日更新创建第一个spring项目来源：科多大数据
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
python学习笔记（汇总）朕的剑还未配妥 python学习笔记整理 python 学习开发语言
文章目录一.基础知识二.python中的数据类型三.运算符四.程序的控制结构五.列表六.字典七.元组八.集合九.字符串十.函数十一.解决bug一.基础知识print函数字符串要加引号，数字可不加引号，如print(123.4)print('小谢')print("洛天依")还可输入表达式，如print(1+3)如果使用三引号，print打印的内容可不在同一行print("line1line2line
Redis 分布式锁深度解析：过期时间与自动续期机制爱恨交织围巾分布式事务 redis 分布式数据库微服务学习 go
Redis分布式锁深度解析：过期时间与自动续期机制在分布式系统中，Redis分布式锁的可靠性很大程度上依赖于对锁生命周期的管理。上一篇文章我们探讨了分布式锁的基本原理，今天我们将聚焦于一个关键话题：如何通过合理设置过期时间和实现自动续期机制，来解决分布式锁中的死锁与锁提前释放问题。一、为什么过期时间是分布式锁的生命线？你的笔记中提到"服务挂掉时未删除锁可能导致死锁"，这正是过期时间要解决的核心问题
08.学习闭环三部曲：预习、实时学习、复习 0058b195f4dc
人生就是一本效率手册，你怎样对待时间，时间就会给你同比例的回馈。单点突破法。预习，实时学习，复习。1、预习：凡事提前【计划】（1）前一晚设置三个当日目标。每周起始于每周日。（2）提前学习。预习法进行思考。预不预习效果相差20％，预习法学会提问。（3）《学会提问》。听电子书。2.实时学习（1）（10％）相应场景，思维导图，快速笔记。灵感笔记。（2）大纲，基本记录，总结篇。3.复习法则，（70％），最
《如何写作》文心读书笔记逆熵反弹力
《文心》这本书的文体是以讲故事的形式来讲解如何写作的，读起来不会觉得刻板。读完全书惊叹大师的文笔如此之好，同时感叹与此书相见恨晚。工作了几年发现表达能力在生活中越来越重要，不管是口语还是文字上的表达。有时候甚至都不能把自己想说的东西表达清楚，平时也有找过一些书来看，想通过提升自己的阅读量来提高表达能力。但是看了这么久的书发现见效甚微，这使得我不得不去反思，该怎么提高表达能力。因此打算从写作入手。刚
SQL笔记纯干货 AI入门修炼 oracle 数据库 sql
软件：DataGrip2023.2.3，phpstudy_pro,MySQL8.0.12目录1.DDL语句（数据定义语句）1.1数据库操作语言1.2数据表操作语言2.DML语句（数据操作语言）2.1增删改2.2题2.3备份表3.DQL语句（数据查询语言）3.1查询操作3.2题一3.3题二4.多表详解4.1一对多4.2多对多5.多表查询6.窗口函数7.拓展:upsert8.sql注入攻击演示9.拆表
《4D卓越团队》习书笔记第十六章创造力与投入 Smiledmx
《4D卓越团队-美国宇航局的管理法则》（查理·佩勒林）习书笔记第十六章创造力与投入本章要点：务实的乐观不是盲目乐观，而是带来希望的乐观。用真相激起希望吉姆·科林斯在《从优秀到卓越》中写道：“面对残酷的现实，平庸的公司选择解释和逃避，而不是正视。”创造你想要的项目1.你必须从基于真相的事实出发。正视真相很难，逃避是人类的本性。2.面对现实，你想创造什么？-我想利用现有资源创造一支精干、高效、积极的橙
2020-12-10 生活有鱼_727f
今日汇总：1.学习了一只舞蹈2.专业知识抄了一遍3.讲师训作业完成今日不足之处：1.时间没管理好，浪费了很多时间到现在才做完明日必做：1.讲师训作业完成2.群消息做好笔记3.宽带安装
【Druid】学习笔记 fixAllenSun 学习笔记 oracle
【Druid】学习笔记【一】简介【1】简介【2】数据库连接池（1）能解决的问题（2）使用数据库连接池的好处【3】监控（1）监控信息采集的StatFilter（2）监控不影响性能（3）SQL参数化合并监控（4）执行次数、返回行数、更新行数和并发监控（5）慢查监控（6）Exception监控（7）区间分布（8）内置监控DEMO【4】Druid基本配置参数介绍【5】Druid相比于其他数据库连接池的优点
微信公众号写作：如何通过文字变现？氧惠爱高省
微信公众号已成为许多人分享知识、表达观点的重要平台。随着自媒体的发展，越来越多的人开始关注微信公众号上写文章如何挣钱的问题。本文将详细探讨微信公众号写作的盈利模式，帮助广大写作者实现文字变现的梦想。公众号流量主就找善士导师（shanshi2024）公众号：「善士笔记」主理人，《我的亲身经历，四个月公众号流量主从0到日入过万！》公司旗下管理800+公众号矩阵账号。代表案例如：爸妈领域、职场道道、国学
流利说懂你英语笔记要点句型·核心课·Level 8·Unit 3·Part 2·Video 1·Healing Architecture 1 羲之大鹅video
HealingArchitecture1EveryweekendforaslongasIcanremember,myfatherwouldgetuponaSaturday,putonawornsweatshirtandhe'dscrapeawayatthesqueakyoldwheelofahousethatwelivedin.ps:从我记事起，每个周末，我父亲都会在周六起床，穿上一件破旧的运动衫
java学习笔记8 幸福，你等等我学习笔记 java
一、异常处理Error：错误，程序员无法处理，如OOM内存溢出错误、内存泄漏...会导出程序崩溃1.异常：程序中一些程序自身处理不了的特殊情况2.异常类Exception3.异常的分类:（1）.检查型异常(编译异常):在编译时就会抛出的异常(代码上会报错),需要在代码中编写处理方式(和程序之外的资源访问)直接继承Exception（2）.运行时异常:在代码运行阶段可能会出现的异常,可以不用明文处理
2025.07 Java入门笔记01 殷浩焕笔记
一、熟悉IDEA和Java语法（一）LiuCourseJavaOOP1.一直在用C++开发，python也用了些，Java是真的不熟，用什么IDE还是问的同事；2.一开始安装了jdk-23，拿VSCode当编辑器，在cmd窗口编译运行，也能玩；但是想正儿八经搞项目开发，还是需要IDE；3.安装了IDEA社区版：（1）IDE通常自带对应编程语言的安装包，例如IDEA自带jbr-21（和jdk是不同的
Java注解笔记 m0_65470938 java 开发语言
一、什么是注解Java注解又称Java标注，是在JDK5时引入的新特性，注解(也被称为元数据)Javaa注解它提供了一种安全的类似注释的机制，用来将任何的信息或元数据(metadata)与程元素类、方法、成员变量等)进行关联二、注解的应用1.生成文档这是最常见的，也是iava最早提供的注解2.在编译时进行格式检查，如@Overide放在方法前，如果你这个方法并不是看盖了超类Q方法，则编译时就能检查
Java 笔记 transient 用法
transient关键字用于标记不希望被序列化（Serialization）的字段。序列化是指将对象的状态保存到字节流中，以便将其传输或存储。当使用如ObjectOutputStream进行序列化时，transient修饰的字段将不会被序列化。✅1.使用场景避免序列化敏感信息privatetransientStringpassword;某些字段不需要持久化（如缓存、临时数据）privatetran
Java 笔记 lambda 五行缺弦 Java笔记 java 笔记
✅Lambda基本语法(parameters)->expression或(parameters)->{statements}//无参数Runnabler=()->System.out.println("Hello");//单个参数（小括号可省略）Consumerc=s->System.out.println(s);//多参数+多语句Comparatorcomp=(a,b)->{System.out
【208】《班级管理课》读书感悟（一百零五）2023-07-23 南风如我意
-----------《班级管理课》读书感悟四文/李现风2023年读书笔记读书笔记以以下三个出发点为目的：一、书中的思想，提升自己的教育理念；二、书中的值得借鉴的做法，提升自己的教育技巧；三、书中的美句，有鉴于哲理性的句子，提升自己文章的语言魅力和教育文化水准。读《班级管理课》作者陈宇读书感悟四：【书目】《班级管理课》【页数】第70页第87页【阅读内容（摘录）】第四课开学一个月：班级常规工作正常运
3步搞定群晖NAS Synology Drive远程同步Obsidian笔记
文章目录1.简介1.1软件特色演示：2.使用免费群晖虚拟机搭建群晖SynologyDrive服务，实现局域网同步2.1安装并设置SynologyDrive套件2.1局域网内同步文件测试3.内网穿透群晖SynologyDrive，实现异地多端同步3.1安装Cpolar步骤4.实现固定TCP地址同步1.简介之前我们介绍过如何免费多端同步Zotero科研文献管理软件，使用了群晖NAS虚拟机和WebDav
R语言笔记Day1（排序、筛选以及分类汇总））养猪场小老板
一、排序1、单变量序列排序2、数据表（矩阵）排序二、筛选三、分类汇总一、排序1、单变量序列排序rank、sort和order函数>aa[1]315#rank用来计算序列中每个元素的秩#这里的“秩”可以理解为该元素在序列中由小到大排列的次序#上面例子给出的序列[3,1,5]中，1最小，5最大，3居中#于是1的秩为1，3的秩为2，5的秩为3，(3,1,5)对应的秩的结果就是(2,1,3)>rank(a
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite

BP神经网络（Back Propagation Neural Network）Matlab简单实现