BigDataDigest

斯坦福CS231n作业代码（汉化）Assignment 2 Q1 - Q3

一段关于神经网络的故事

编写：土豆 MoreZheng SlyneD
校对：碧海听滔 Molly
总校对与审核：寒小阳

一段关于神经网络的故事
- 待折腾的数据集
- 关于神经网络你起码应该知道的
- 所谓的前向传播
  - 一个神经元的本事
  - 强大的层状神经元
  - 不废话了看代码
- 传说中的反向传播
  - 审判官损失函数登场
  - 跟着梯度走
  - 链式的反向传播
  - 小结拉起神经网络的大网
- 高速运转的加强版神经网络
  - 论自我惩罚后的救赎之路正则化
  - 批量归一化
  - 就是这么任性Dropout
  - 构造任意深度的神经网络
- 最终章
  - 漫漫优化路SGD with momentum
  - 夜黑风高小试牛刀

To-Do：

[x] 统一所有的数学符号和代码符号

[x] 统一所有的术语名称

[x] 术语的英文词汇对应

[x] 线性模型的名字是？perceptron？

[x] 损失函数的计算公式和符号是否严格和合适？

[x] denominator layout？

[ ] BN梯度的证明

[x] bn_param[‘running_mean’] = running_mean
bn_param[‘running_var’] = running_var

（我是盗图大仙，所有图片资源全部来源于网络，若侵权望告知～）

本文是什么？

本文以CS231n的Assignment2中的Q1-Q3部分代码作为例子，目标是由浅入深得搞清楚神经网络，同时以图片分类识别任务作为我们一步一步构建神经网路的目标。

本文既适合仅看得懂一点Python代码、懂得矩阵的基本运算、听说过神经网络算法这个词的朋友，也适合准备学习和正在完成CS231n课程作业的朋友。

本文内容涉及：很细节的Python代码解析 + 神经网络中矩阵运算的图像化解释 + 模块化Python代码的流程图解析

本文是从Python编程代码的实现角度理解，一层一层拨开神经网络的面纱，以搞清楚数据在其中究竟是怎么运动和处理的。希望可以为小白，尤其是为正在学习CS231n课程的朋友，提供一个既浅显又快捷的观点，用最直接的方式弄清楚并构建一个神经网络出来。所以，此文不适合章节跳跃式阅读。

本文不是什么？

不涉及艰深的算法原理，忽略绝大多数数学细节，也尽量不扯任何生涩的专业术语，也不会对算法和优化处理技术做任何横向对比。

CS231n课程讲师Andrej Karpathy在他的博客上写过一篇文章Hacker’s guide to Neural Networks，其中的精神是我最欣赏的一种教程写作方式：“My exposition will center around code and physical intuitions instead of mathematical derivations. Basically, I will strive to present the algorithms in a way that I wish I had come across when I was starting out.”

“…everything became much clearer when I started writing code.”

废话不多说，找个板凳坐好，慢慢听故事～

待折腾的数据集

俗话说得好：皮裤套棉裤，里边有缘故；不是棉裤薄，就是皮裤没有毛！

我们的神经网络是要用来解决某特定问题的，不是家里闲置的花瓶摆设，模型的构建都有着它的动机。所以，首先让我们简单了解下要摆弄的数据集（CIFAR-10），最终的目标是要完成一个图片样本数据源的分类问题。

图像分类数据集：CIFAR-10。
这是一个非常流行的图像分类数据集是CIFAR-10。这个数据集包含了60000张 32×32 的小图像，单个像素的数值范围都在0-255之间。每张图像都对应于是10种分类标签(label)中的一种。此外，这60000张图像被分为包含带有标签的50000张图像的训练集和包含不带有标签的10000张图像的测试集。

上图是图片样本数据源CIFAR-10中训练集的一部分样本图像，从中你可以预览10个标签类别下的10张随机图片。

小结：

在我们的故事中，只需要记得这个训练集是一堆 32×32 的RGB彩色图像作为训练目标，一个样本图像共有 32×32×3 个数据，每个数据的取值范围0~255，一般用x来标记。每个图还配有一个标签值，总共10个标签，以后我们都用y来标记。（悄悄告诉你的是：每个像素点的3个数据维度是有序的，分别对应红绿蓝(RGB)）

关于神经网络，你起码应该知道的！

下图是将神经网络算法以神经元的形式绘制的两个图例，想必同志们早已见怪不怪了。

但是，你起码应该知道的是其中各种约定和定义：

左边是一个2层神经网络，一个隐藏层(蓝色层)有4个神经元(也可称为单元(unit))组成，输出层(绿色)由2个神经元组成，输入层(红色)是3个”神经元”。右边是一个3层神经网络，两个隐藏层，每层分别含4个神经元。注意：层与层之间的神经元是全连接的，但是层内的神经元不连接（如此就是所谓全连接层神经网络）。

这里有个小坑：输入层的每个圈圈代表的可不是每一张图片，其实也不是神经元。应该说整个纵向排列的输入层包含了一张样本图片的所有信息，也就是说，每个圈圈代表的是某样本图片对应位置的像素数值。可见对于CIFAR-10数据集来说，输入层的维数就是 32×32×3 ，共3072个圈圈呢！至于输出层的神经元数也是依赖数据集的，就CIFAR-10数据集来说，输出层维数必然是10，即对应数据集的10个标签。至于中间的隐藏层可以有多少层，以及每层的神经元个数就都可以任意啦！你说牛不牛？！

在接下来我们的故事中，要从代码实现的角度慢慢剖析，先从一个神经元的角度出发，再搞清楚一层神经元们是如何干活的，然后逐渐的弄清楚一个含有任意神经元个数隐藏层的神经网络究竟是怎么玩的，在故事的最后将会以CIFAR-10数据集的分类问题为目标一试身手，看看我们构造的神经网络究竟是如何工作运转的。

所谓的前向传播

一个神经元的本事

我们先仅前向传播而言，来谈谈一个神经元究竟是做了什么事情。

前向传播，这名字起的也是神乎其神的，说白了就是将样本图片的数据信息，沿着箭头正向传给一个带参数的神经网络层中咀嚼一番，然后再吐出来一堆数据再喂给后面的一层吃(如此而已，居然就叫做了前向/正向传播了，让人忍不住吐槽一番)。那么，对于一个全连接层(fully-connected layer) 1

的前向传播来说，所谓的“带参数的神经网络层”一般就是指对输入数据源(此后用”数据源”这个词来表示输入层所有输入样本图片数据总体)先进行一个矩阵乘法，然后加上偏置，得到数字再运用激活函数”修饰”，最后再反复迭代罢了（后文都默认使用此线性模型）。

是不是晕了？别着急，我们进一步嚼碎了来看看一个神经元(处于第一隐藏层)究竟是如何处理输入层传来的一张样本图片(带有猫咪标签)的？

上面提到过，输入数据源是一张尺寸为 32×32 的RGB彩色图像，我们假定输入数据 xi 的个数是 D 的话（即 i 是有 D 个），那这个 D=32×32×3=3072 。为了普遍意义，下文继续用大写字母 D 来表示一张图片作为数据源的维数个数（如果该神经元位于隐藏层，则大写字母 D 表示本隐藏层神经元的神经元个数，下一节还会提到）。

显然，一张图片中的 D 个数据 xi 包含了判断该图片是一支猫的所有特征信息，那么我们就需要”充分利用”这些信息来给这张样本图片”打个分”，来评价一下这张图像究竟有多像猫。

不能空口套白狼，一张美图说明问题：

左图不用看，这个一般是用来装X用的，并不是真的要严格类比。虽然最初的神经网络算法确实是受生物神经系统的启发，但是现在早已与之分道扬镳，成为一个工程问题。关键我们是要看右图的数学模型(严格地说，这就是传说中的感知器perceptron)。

如右图中的数学模型所示，我们为每一个喂进来的数据 xi 都对应的”许配”一个”权重”参数 wi ，再加上一个偏置 b ，然后一股脑的把他们都加起来得到一个数(scalar)：

\sum i w i x i + b = w 0 x 0 + w 1 x 1 + \dots + w D - 1 x D - 1 + b

上面的代数表达式看上去很繁杂，不容易推广，所以我们把它改写成

[\sum i w i x i + b]          1 \times 1 = [\dots x i \dots]          1 \times D \cdot ⎡ ⎣ ⎢ ⎢ ⎢ ⋮ w i ⋮ ⎤ ⎦ ⎥ ⎥ ⎥ ⏟ D \times 1 + [b] ⏟ 1 \times 1

上面等式左侧这样算出的一个数字，表示为对于输入进来的

D 个数据

xi ，在当前选定的参数

(wi,b) 下，这个神经元能够正确评价其所对应的”猫咪”标签的程度。所以，这个得分越高，越能说明其对应的在某种

(wi,b) 这

D+1 个参数的评价下，该神经元正确判断的能力越好，准确率越高。

换句话说，相当于是有一个神经元坐在某选秀的评委席里，戴着一款度数为 (wi,b) 雷朋眼镜，给某一位台上模仿猫咪的样本图片 xi 打了一个分(评价分数)。显然，得分的高低是不仅依赖于台上的主角 xi 的表现，还严重依赖于神经元评委戴着的有色眼镜(参数 wi,b )。当然，我们已经假定评委的智商(线性模型)是合乎统一要求的。

现如今，参加选秀的人可谓趋之若鹜，一个神经元评委该如何同时的批量化打分，提高效率嗯？

也就是说，一个神经元面对 N 张图片该如何给每一张图片打分的问题。这就是矩阵表达式的优势了，我们只需要很自然地把上述矩阵表达式纵向延展下即可，如下所示：

⎡ ⎣ ⎢ ⎢ \sum i w i x i + b ⋮ ⎤ ⎦ ⎥ ⎥          N \times 1 = [\dots x i ⋮ \dots]          N \times D \cdot ⎡ ⎣ ⎢ ⎢ ⎢ ⋮ w i ⋮ ⎤ ⎦ ⎥ ⎥ ⎥ ⏟ D \times 1 + ⎡ ⎣ ⎢ ⎢ ⎢ b ⋮ ⋮ ⎤ ⎦ ⎥ ⎥ ⎥ ⏟ N \times 1

上面矩阵表达式中，等号左侧的得分矩阵中每一行运算都是独立并行的，并且其每一行分别代表

N 张样本图片的数据经过一个神经元后的得分数值。到此，我们就明白了一个神经元是如何面对一个shape为(N, D)的输入样本图片数据矩阵，并给出得分的。

然而，关于一个神经元的故事还没完。

你可能注意到了，上面例子中的美图中有个函数f，我们把图放大仔细看清楚：

在神经元对每张图片算得的“得分”送给下一个神经元之前都要经过一个函数f的考验。这就暗示我们，选秀节目的导演对神经元评委给出的得分还并不满意，为了(未来模型训练的)快捷方便，导演要求对每一个得分需要做进一步的“激活”处理（即上图中的函数 f ），于是这个叫激活函数(activation)的家伙会对结果做进一步的处理、比如大家这些年都在用的ReLU就是临门一脚，要求把得分小于零的都阉割掉，一律给0分（都得负分的了还选什么秀啊？给0分滚蛋）：

f (x) = max (0, x)

所以，总结下来，一个神经元干的活就是如下所示的公式：

out = f (\sum i w i x i + b) = max (0, \sum i w i x i + b)

如果这个数学看得让人心烦意乱，不要怕，一层神经元的故事之后就是万众期待的Python代码实现了，相信看后会让你不禁感慨：“小样！不过如此嘛～”

小备注：

这里最后再多一句嘴：一个神经元在前向传播中输出的只是一个数字，另外，神经网络的训练过程，训练的是上述提到的模型参数 (wi,b) 。

再多一句嘴，通常我们在整个神经网络结构中只使用一种激活函数。并且值得你注意的是，全连接层的最后一层就是输出层，除了这个最后一层，其它的全连接层神经元都要包含激活函数。

最最后说再一句，神经网络的激活函数是非线性的，所以神经网络是一个非线性分类器。

强大的层状神经元

在正式开始谈一层神经元之前，我们继续来探讨下神经元面对一张图片还可以做什么？

对于一张标签是猫咪的样本图片，我们光能评价有多么的像猫咪还不能满足，我们还需要神经元评价一下其他9个标签才行，然后才好比较评判得出最终结论。于是，光用 (wi,b) 这 D+1 个参数就不够用了，应该要有 10×(D+1) 个参数才行。还是用那个恶搞的例子说明的话，就是说一个神经元评委可不够用哦，要10个戴着不同有色眼镜的神经元评委分头去考察10个不同标签，这样就可以对每个样本图片给出10个对应不同类别的得分。

所以，我们可以在最初的矩阵表达式 ∑iwixi+b 的基础上横向延展成如下矩阵表达式：

[\sum i w i x i + b \dots]                1 \times 10 = [\dots x i \dots]          1 \times D \cdot ⎡ ⎣ ⎢ ⎢ ⎢ ⋮ w i ⋮ \dots \dots ⎤ ⎦ ⎥ ⎥ ⎥          D \times 10 + [b \dots]        1 \times 10 Broadcasting

忘了说，在上面表达式里，大括号下面的数字表示的是当前矩阵的【行数

× 列数】。同样地，这里运用了矩阵乘法和向量化表示会大大的提高运算效率。在如此简单的矩阵运算之后，等号左边所得到一行数组(行向量)就表达了在参数矩阵w和向量b的描述下，该一张样本图片分别对应10个不同类标标签的得分。而我们最终的目标就是学习如何训练这里的参数w和b，并且我们希望训练好后的某样本图片在正确目标标签下所对应的得分是最高的。

为了便于直观理解，给你一个数值栗子尝尝鲜（和上面的矩阵公式有点区别，但并不影响理解）：

可以看到我们拿了样本猫咪图片中的四个像素作为一个神经元的输入数据源，不过上图只查看了3个标签(猫／狗／船)，且把输入数据 xi 改成用列向量表达罢了，这并不影响我们理解，无非是我们的矩阵公式改为 wTx+bT 表达。接下来看图说话，可以看到在如图初始化矩阵 W 和 b 的情况下，算出的得分对应于猫咪的分数居然是最低的2

，这说明 W 和 b 的值没有训练好啊。那么究竟该如何训练出合适的参数呢？难道每次都要肉眼观察每个标签算出的得分再同时对比参数选的究竟好不好？再难道每次都要自己手调参数矩阵的每个值来观察得分效果么？当然不会这么傻啦，到时候一个叫损失函数的概念就登场了，且继续听故事先～

回到上面经过横向延展后的矩阵表达式：

[\sum i w i x i + b \dots]                1 \times 10 = [\dots x i \dots]          1 \times D \cdot ⎡ ⎣ ⎢ ⎢ ⎢ ⋮ w i ⋮ \dots \dots ⎤ ⎦ ⎥ ⎥ ⎥          D \times 10 + [b \dots]        1 \times 10 Broadcasting

可以看到对于一个

D 维图片

xi ，都和w矩阵的每一列(10个神经元评委)有过亲密接触，独立并行的进行过矩阵乘法，回想一下，这不和一个神经元面对一张样本图片的公式异曲同工了么？只不过换成了10个神经元并行面对一张样本图片。所以，上述矩阵表达式就相当于一张图片的数据从输入层流到含有10个神经元的层状结构（无激活函数）。（严格地说，这其实是 无隐层神经网络，或者叫 单层感知器，因为输入层的下一层就是输出层，直接输出了10个标签的打分结果了，如下面的示意图）

接下来，推广到一般的隐藏层神经元们是如何干活的就易如反掌了！只要充分利用矩阵乘法，就可以很清楚了。小结如下：

⎡ ⎣ ⎢ ⎢ max (0, x ̂ i) ⎤ ⎦ ⎥ ⎥            N \times M = \leftarrow ⎡ ⎣ ⎢ ⎢ x ̂ i ⎤ ⎦ ⎥ ⎥      N \times M = \leftarrow ⎡ ⎣ ⎢ ⎢ x i ⎤ ⎦ ⎥ ⎥      N \times H \cdot ⎡ ⎣ ⎢ ⎢ ⎢ w i j ⎤ ⎦ ⎥ ⎥ ⎥      H \times M + ⎡ ⎣ ⎢ ⎢ b i ⎤ ⎦ ⎥ ⎥      N \times M Broadcasting

从右往左看公式(等号类似赋值操作)。上述矩阵表达式表示的是某一隐藏层的H个神经元们在面对上一层输入数据

xi 是如何传给下一层的M个神经元的。N表示数据样本的个数，H表示本隐藏层神经元的个数，M表示下一隐藏层神经元的个数(或位于下一输出层的样本图片标签种类数)。（最后矩阵b里的Broadcasting含义见后文哈～不要急）

每一个隐藏层得出得分 x̂ i 后，都还需要经过激活函数 f(x̂ i)=max(0,x̂ i) 的处理，要留意的是最后的输出层并不需要激活函数，给出得分后即可交给损失函数(后文会提到)。

小备注：

值得注意的是：流入每一层神经元们的输入数据矩阵x和流出每一层神经元们的输出数据矩阵的行数没有变化，都是N，即样本图片个数。每一层神经元们的参数矩阵w和b都是不同的，那么你就能想象到对于一个”很大很深”神经网络而言，需要训练学习的参数个数可是相当多的哦～而且参数矩阵w的维数也很有特点，其行数H和列数M，分别对应于当前隐藏层神经元个数和下一层神经元的个数。如此一来，就把每一层神经元一层套一层连接起来了。

不废话了，看代码！

正如本文开头那句话，

“…everything became much clearer when I started writing code.”

再强大的算法，无论矫情得怎么解释，也都不如直接飞代码来得更清晰，更直接。

那么任意某一层神经元们在前向传播中，究竟做了什么呢？前面总算把数据如何运动的故事说清楚了，现在开始直接用代码说明一切，第一步，我们定义面对输入数据某一层神经元们给出“得分”的函数 affine_forward(x, w, b) = (out, cache) ：

def affine_forward(x, w, b):
    """ Inputs: - x: A numpy array containing input data, of shape (N, d_1, ..., d_k) 样本 - w: A numpy array of weights, of shape (D, M) 权重 - b: A numpy array of biases, of shape (M,) 偏置 Returns a tuple of: - out: output, of shape (N, M) - cache: (x, w, b) """
    out = None      # 初始化
    reshaped_x = np.reshape(x, (x.shape[0],-1))     # 确保x是一个规整的矩阵
    out = reshape_x.dot(w) +b                       # out = w x +b
    cache = (x, w, b)                               # 将该函数的输入值缓冲储存起来，以备后面计算梯度时使用
    return out, cache

代码详解：

首先，需要对输入数据 x 进行矩阵化，这是因为如果这代表的是第一层神经元前向传播，那么对于我们的图片数据集CIFAR-10，其每张图片输入进来的数据 x 的shape是 (N,32,32,3) ，是一个4维的array，所以需要将其reshape成 (N,3072) 的2维矩阵，其中每行是由一串3072个数字所代表的一个图片样本。np.reshape(x, (x.shape[0],-1)) 中的 -1 是指剩余可填充的维度，所以这段代码意思就是保证reshape后的矩阵行数是 N ，剩余的维度信息都规则的排场一行即可。
输出的 cache 变量就是把该函数的输入值 (x,w,b) 存为元组(tuple)再输出出去以备用，它当然不会流到下一层神经元，但其在后面会讲到的反向传播算法中利用到，由此可见我们是有多么的老谋深算啊！
接下来是重点： out = reshape_x.dot(w) +b 这句代码就表达了某一层神经元中，每个神经元可以并行的独立完成上两节提到的线性感知器模型，对每个图像给出自己的评价分数，与代码对应一致的内涵可见如下矩阵表达式：

⎡ ⎣ ⎢ ⎢ out ⎤ ⎦ ⎥ ⎥        N \times M = ⎡ ⎣ ⎢ ⎢ reshape_x ⎤ ⎦ ⎥ ⎥            N \times D \cdot ⎡ ⎣ ⎢ ⎢ w ⎤ ⎦ ⎥ ⎥      D \times M + ⎡ ⎣ ⎢ ⎢ b ⎤ ⎦ ⎥ ⎥      N \times M Broadcasting

这里你要清楚的是 reshape_x 中每一行和 w 中的每一列的运算对应于一个神经元面对一张图片的运算过程。矩阵乘法没啥可说的，只要把输入矩阵和要输出的矩阵的维数掰扯清楚了，就会很简单。这里参数w和b都作为函数的输入参数参与运算的，可见你想让神经网络运作起来，你是需要先初始化所有的神经网络参数的，那么究竟如何初始化呢？这还是门小学问，我们暂且假定是随机填了些的参数进来。虽然输入进来的参数 b 的shape是 (M,)，但在numpy中，两个array的”+”相加，是完全等价于np.add()函数(详情可help该函数)，这里体现了numpy的Broadcasting机制：(详情可查看Python库numpy中的Broadcasting机制解析)

简单的说，对两个阵进行操作时，NumPy逐元素地比较他们的形状。只有两种情况下Numpy会认为两个矩阵内的两个对应维度是兼容的：1. 它们相等； 2. 其中一个是1维。举个例子：
A      (4d array):  8 x 1 x 6 x 1
B      (3d array):      7 x 1 x 5
Result (4d array):  8 x 7 x 6 x 5
当任何一个维度是1，那么另一个不为1的维度将被用作最终结果的维度。也就是说，尺寸为1的维度将延展或“逐个复制”到与另一个维度匹配。

所以代码中的偏置b，其shape为(M,)，其实它表明是一个 1×M 的行向量，面对另一个 N×M 的矩阵，b 便遇强则强的在弱势维度上(纵向)被延展成了一个 N×M 的矩阵：

>⏐↓⏐⏐⏐⎡⎣⎢⎢>⋯>⋯>⋯bbb⋯⋯⋯>⎤⎦⎥⎥⎫⎭⎬⎪⎪N行>

虽然，我们说清楚了 affine_forward(x,w,b) 函数的故事，但要注意的是，在前向传播中一层神经元要干的活还没完哦～在隐藏层中得到的得分结果还需要ReLU激活函数“刺激”一下才算结束。

于是我们再定义 relu_forward(x) = (out, cache) 函数来完成这一步，其Python代码就更简单了：

def relu_forward(x):
    """ Computes the forward pass for a layer of rectified linear units (ReLUs). Input: - x: Inputs, of any shape Returns a tuple of: - out: Output, of the same shape as x - cache: x """
    out = np.maximum(0, x)   # 取x中每个元素和0做比较
    cache = x                # 缓冲输入进来的x矩阵
    return out, cache

代码详解：

我们可以注意到，np.maximum() 函数中的接受的两个参数一样用到了刚刚详解过的Broadcasting机制：前一个参数是只有一个维度的数值0，被延展成了一个和矩阵x同样shape的矩阵，然后在对应元素上比大小(相当于矩阵x的所有元素中把比0小的元素都替换成0)，取较大元素填在新的同shape形的矩阵out中。

那么，终于到最后了。一个隐藏层层神经元们在前向传播中究竟做了什么呢？那就是下面定义的 affine_relu_forward(x, w, b) = (out, cache) 函数：

def affine_relu_forward(x, w, b):
    """ Convenience layer that perorms an affine transform followed by a ReLU Inputs: - x: Input to the affine layer - w, b: Weights for the affine layer Returns a tuple of: - out: Output from the ReLU - cache: Object to give to the backward pass """
    a, fc_cache = affine_forward(x, w, b) # 线性模型
    out, relu_cache = relu_forward(a)   # 激活函数
    cache = (fc_cache, relu_cache)  # 缓冲的是元组：(x, w, b, (a))
    return out, cache

这里还是要留个心眼，对于输出层的神经元们来说，他们只需要用 affine_forward(x, w, b) 函数给出得分即可，无需再被”激活”。

小结一下：

我们手绘一张图来说清楚，一隐藏层神经元们在前向传播的 affine_relu_forward() 函数中，数据变量在模块代码中究竟是如何流动的：

传说中的反向传播

关于传说中的反向传播，首先我们最重要的是要明白：我们为什么需要这个反向传播？

然而，要想弄清楚这点，我们就需要回头考察下我们前向传播下最后输出层得到10个标签的评分究竟有什么用。这个问题的答案，将会直接引出故事中的审判官——损失函数。

前情提要：

在前向传播(从左向右)中，输入的图像数据 xi (以及所对应的正确标签 yi )是给定的，当然不可修改，唯一可以调整的参数是权重矩阵W(大写字母W表示神经网络中每层权重矩阵w的集合)和参数B(大写字母表示神经网络中每层偏置向量b的集合)，即上图中每一条黑色的线和黑色的圈。所以，我们希望通过调节参数(W, B)，使得最后评分的结果与训练数据集中图像的真实类别一致，即输出层输出的评分在正确的分类上应当得到最高的评分。

审判官！损失函数登场！

回到之前那张用来尝鲜的猫的图像分类栗子，它有针对“猫”，“狗”，“船”三个类别的分数。我们看到例子中权重值非常差，因为猫分类的得分非常低（-96.8），而狗（437.9）和船（61.95）比较高。正如上文提到的，究竟该如何让计算机自动地判别得分的结果与正确标签之间的差异，并且对神经网络所有参数给出改进意见呢？

我们自己仅凭肉眼和肉脑当然是做不了审判官的，但是一个叫做损失函数（Loss Function）（有时也叫代价函数Cost Function或目标函数Objective）的可以做到！直观地讲，当输出层的评分给出结果与真实结果之间差异越大，我们的审判官——损失函数就会给出更加严厉的判决！举起一个写有很大的判决分数，以表示对其有多么的不满！反之差异若越小，损失函数就会给出越小的结果。

我们这里请的是交叉熵损失（cross-entropy loss）来作为最终得分的审判官！废话少说，直接看代码！

def softmax_loss(z, y):
    """ Computes the loss and gradient for softmax classification. Inputs: - z: Input data, of shape (N, C) where z[i, j] is the score for the jth class for the ith input. - y: Vector of labels, of shape (N,) where y[i] is the label for x[i] and 0 <= y[i] < C Returns a tuple of: - loss: Scalar giving the loss - dz: Gradient of the loss with respect to z """
    probs = np.exp(z - np.max(z, axis=1, keepdims=True))    # 1
    probs /= np.sum(probs, axis=1, keepdims=True)           # 2
    N = z.shape[0]                                          # 3
    loss = -np.sum(np.log(probs[np.arange(N), y])) / N      # 4
    dz = probs.copy()
    dz[np.arange(N), y] -= 1
    dz /= N
    return loss, dz

代码详解：

softmax_loss(z, y) 函数的输入数据是shape为(N, C)的矩阵z和shape为(N, )的一维array行向量y。由于损失函数的输入数据来自神经网络的输出层，所以这里的矩阵z中的N代表是数据集样本图片的个数，C代表的是数据集的标签个数，对应于CIFAR-10的训练集来说，z矩阵的shape应该为(50000, 10)，其中矩阵元素数值就是CIFAR-10的训练集数据经过整个神经网络层到达输出层，对每一张样本图片(每行)打分，给出对应各个标签(每列)的得分分数。一维array行向量y内的元素数值储存的是训练样本图片数据源的正确标签，数值范围是 0⩽yi<C=10 ，亦即 yi=0,1,…,9 。
前2行代码定义了probs变量。首先，np.max(z, axis=1, keepdims=True) 是对输入矩阵x在横向方向挑出一个最大值，并要求保持横向的维度输出一个矩阵，即输出为一个shape为(N, 1)的矩阵，其每行的数值表示每张样本图片得分最高的标签对应得分；然后，再 np.exp(z - ..) 的操作表示的是对输入矩阵z的每张样本图片的所有标签得分都被减去该样本图片的最高得分，换句话说，将每行中的数值进行平移，使得最大值为0；再接下来对所有得分取exp函数，然后在每个样本图片中除以该样本图片中各标签的总和(np.sum)，最终得到一个与矩阵z同shape的(N, C)矩阵probs。上述得到矩阵probs中元素数值的过程对应的就是softmax函数：

S i j \equiv e z i j \sum j e z i j = C e z i j C \sum j e z i j = e z i j + log C \sum j e z i j + log C \equiv probs

其中，我们已经取定了 C 的值： logC=−maxizij ，且 zij(z;W,B) 对应于代码中的输出数据矩阵x的第 i 行、第 j 列的得分z[i, j]，其取值仅依赖于从输出层输入来的数据矩阵z和参数 (W,B) ，同理， Sij 表示矩阵probs的第 i 行、第 j 列的新得分。我们举一个简单3个图像样本，4个标签的输入数据矩阵x的栗子来说明得分有着怎样的变化：

z i j \equiv ⎡ ⎣ ⎢ ⎢ 123123123235 ⎤ ⎦ ⎥ ⎥          3 \times 4 ⟹ - max ⎡ ⎣ ⎢ ⎢ - 1 - 1 - 2 - 1 - 1 - 2 - 1 - 1 - 2 000 ⎤ ⎦ ⎥ ⎥              3 \times 4 ⟹ exp ⎡ ⎣ ⎢ ⎢ 0.368 0.368 0.135 0.368 0.368 0.135 0.368 0.368 0.135 111 ⎤ ⎦ ⎥ ⎥                    3 \times 4 ⟹ 1 / sum ⎡ ⎣ ⎢ ⎢ 0.175 0.175 0.096 0.175 0.175 0.096 0.175 0.175 0.096 1 / 2.104 1 / 2.104 1 / 1.405 ⎤ ⎦ ⎥ ⎥                        3 \times 4 \equiv probs i j

可以看到”新得分矩阵”probs的取值范围为

(0,1) 之间，并且矩阵每行的数值之和为1，由此可看出来每张样本图片分布在各个标签的得分有概率的含义。

这个图是另一个小例子来说明Softmax函数可以镶嵌在输出层中，相当于其他隐藏层神经元们中的激活函数一样，用Softmax函数对输出层算得的得分进行了一步“激活”操作。

定义损失函数： loss = -np.sum(np.log(probs[np.arange(N), y])) / N，输出是一个scalar数 loss。其数学含义是这样的

L \equiv \sum i; j = y i L i j = - 1 N \sum i; j = y i log (S i j) = - 1 N \sum i; j = y i log (e z i j \sum j e z i j)

其中的 ∑i;j=yi 表示的是对每个图片正确标签下的得分全部求和。听上去很晕是不是？还是痛快的给个栗子就清楚了：

S i j = probs i j \equiv ⎡ ⎣ ⎢ ⎢ 0.175 0.175 0.096 0.175 0.175 0.096 0.175 0.175 0.096 1 / 2.104 1 / 2.104 1 / 1.405 ⎤ ⎦ ⎥ ⎥                        3 \times 4 y i \equiv [201]        1 \times 3 ⎫ ⎭ ⎬ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⟹ probs[np.arange(N), y] ⟹ log ⟹ - 1 N sum [0.175 0.096 0.175]                1 \times 3 [- 1.743 - 2.343 - 1.743]                    1 \times 3 - 1 3 (- 1.743 - 2.343 - 1.743) \Rightarrow L

上图的例子依旧是3个图像样本，4个标签从输出层输出数据矩阵x，同时利用到了该三个图像样本的正确标签y。我们通过对probs矩阵的切片操作，即 probs[np.arange(N), y]，取出了每个图片样本在正确标签下的得分(红色数字)。这里值得留意的是向量y的标签取值范围(0~9)刚好是可以对应于probs矩阵每列的index。

详解一下：probs[np.arange(N), y]

在例子中，对probs矩阵确切的切片含义是 probs[np.array([0, 1 ,2]), np.array([2, 0, 1])]

这就像是定义了经纬度一样，指定了确切的行列数，要求切片出相应的数值。对于上面的例子而已，就是说取出第0行、第2列的值；取出第1行、第0列的值；取出第2行、第1列的值。于是，就得到了例子中的红色得分数值。切行数时，np.arange(N) 相当于是说“我每行都要切一下哦～”，而切列数时，y 向量(array)所存的数值型分类标签(0~9)，刚好可以对应于probs矩阵每列的index(0~9)，如果 y = np.array(['cat', 'dog', 'ship']) ，显然代码还这么写就会出问题了。

再简单解释一下上面获得loss损失函数的过程：我们首先对输出层输出的矩阵x做了一个”概率化”的rescale操作，改写为同shape的矩阵probs，使得每张样本图片的正确得分数值是足够充分考虑到了其他标签得分的(概率化)，可见，Softmax分类器为每种分类都提供了“可能性”；然后针对这个矩阵probs，取出每个样本图片的正确标签所对应得分，再被单调递增函数log和sum取平均值操作后，取其负值即为损失函数的结果了。最后要说一下，公式中负号的存在，并不仅仅保证了一个正定的损失函数，还使得若损失函数的结果越小，那么就意味着我们最初追求的是正确标签下得分越高，整个神经网络模型的参数就训练得越好，其中的关联性正是损失函数的数学定义中单调递增函数exp和log的保证下所实现的。

由此很显然，在一整套层状神经网络框架里，我们希望能够得到让我们满意的模型参数(W, B)，只需要使得损失函数最小，就说明我们的模型参数(W, B)取得好哈！

所以说，找输出层给出的得分和正确标签得分差距小的参数(W, B)的问题，就被转移为究竟什么样的参数(W, B)使得损失函数最小！

跟着梯度走！

别忘了代码中的 softmax_loss(z, y) 函数最后还有三行哈！它非常重要，是除了评分函数和损失函数之外，体现的是神经网络算法的第三个关键组成部分：最优化Optimization！最优化是寻找能使得损失函数值最小化的参数(W, B)的过程。由于每当我们取定的模型参数(W, B)稍微变化一点点的时候，最后算得的损失函数应该也会变化一点点。自然地，我们就非常希望模型参数每变化一点点的时候，损失函数都刚好能变小一点点，也就是说损失函数总是很乖地向着变小的方向变化，最终达到损失函数的最小值，然后我们就收获到理想的模型参数(W, B)。若真如此，不就省下了“踏破铁鞋无觅处”，反而“得来全不费工夫“！那么究竟怎么走才能才能如此省心省事呢？

这时候，就有必要引出梯度这个概念了。因为，我们希望能够看到损失函数是如何随着模型参数的变化而变化的，也就是说损失函数与模型参数之间的变化关系，然后才好进一步顺着我们想走的可持续发展的道路上，”衣食无忧，顺理成章，奔向小康～”

那么究竟什么是梯度呢？

梯度的本意是一个向量（矢量），表示某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向（此梯度的方向）变化最快，变化率最大（为该梯度的模）。一张小图来解释梯度怎么用：

上图中的曲面是二元函数 f(x,y) 在自变量 (x,y) 的图像。图上箭头就表示该点处函数f关于坐标参数x,y的梯度啦！从我们的神经网络角度去看，二元函数 f(x,y) 可以对应于模型最终算得的损失函数loss，其自变量就是模型的参数(W, B)。如果我们让训练样本图片经过一次神经网络，最后就可以得到一个损失值loss，再根据我们初始选定的模型参数(W, B)，就也可以在上面的(高维)曲面上找到一点对应。假若我们同时也知道了该点处loss的梯度，记号为grad，那么也就意味着参数(W, B)如果加上这个grad数值，在新参数(W+grad, b+grad)下让样本图片经过神经网络新计算出来的loss损失值一定会更大一些，这正是梯度的定义所保证的，如下图：(注：梯度grad是可为正也可为负的)

但是不要忘了，我们的目标是希望得到损失函数loss最小时的参数(W, B)，所以我们要让神经网络的参数(W, B)在每次有样本图片经过神经网络之后，都要让所有参数减去梯度(加负梯度)的方式来更新所有的参数，这就是所谓的梯度下降（gradient descent）。最终，使得损失函数关于模型参数的梯度达到足够小，即接近损失函数的最小值，就可以真正完成我们神经网络最优化的目的（更详细实现梯度下降的故事，我们留到最后的来说明）。

那么，如何在每一次有样本图片经过神经网络之后，得到损失函数关于模型参数的梯度呢？

寒暄到此为止，我们再贴一遍 softmax_loss(z, y) = (loss, dx) 函数代码，来观察下后三行代码里损失函数关于输出层输出数据矩阵z的梯度是如何计算出的：

def softmax_loss(z, y):
    """ Computes the loss and gradient for softmax classification. Inputs: - z: Input data, of shape (N, C) where z[i, j] is the score for the jth class for the ith input. - y: Vector of labels, of shape (N,) where y[i] is the label for x[i] and 0 <= y[i] < C Returns a tuple of: - loss: Scalar giving the loss - dz: Gradient of the loss with respect to z, of shape (N, C) """
    probs = np.exp(z - np.max(z, axis=1, keepdims=True))
    probs /= np.sum(probs, axis=1, keepdims=True)
    N = z.shape[0]
    loss = -np.sum(np.log(probs[np.arange(N), y])) / N
    dz = probs.copy()           # 1 probs.copy() 表示获得变量probs的副本
    dz[np.arange(N), y] -= 1    # 2 
    dz /= N                     # 3
    return loss, dz

代码解析：

这里的后三行计算出的 dz 变量是损失函数关于从输出层输入来的数据矩阵z的梯度，其shape与数据矩阵z相同，即(N, C)。其严格的数学解析定义(证明过程)是：

\partial L i j \partial z i j = 1 N (S i j - 1), \partial L i j \partial z i l = 1 N S i l, (l \neq j) ⎫ ⎭ ⎬ ⎪ ⎪ ⎪ ⎪ \Rightarrow d L \equiv \sum i; j = y i d L i j = \sum i [1 N (S i y j - 1) d z i y i + 1 N S i l d z i l], (l \neq y i)

不明白数学没有关系，只需要清楚我们算得的梯度是损失函数关于从输出层输入来的数据矩阵x上的梯度 ∂L/∂x 就足够了，直接看代码来弄清楚数据是如何运动的：

S i j \equiv ⎡ ⎣ ⎢ ⎢ 0.175 0.175 0.096 0.175 0.175 0.096 0.175 0.175 0.096 1 / 2.104 1 / 2.104 1 / 1.405 ⎤ ⎦ ⎥ ⎥                        3 \times 4 y i \equiv [201]        1 \times 3 ⎫ ⎭ ⎬ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⟹ d x [np.arange(N), y] - = 1 ⎡ ⎣ ⎢ ⎢ 0.175 - 0.825 0.096 0.175 0.175 - 0.904 - 0.825 0.175 0.096 1 / 2.104 1 / 2.104 1 / 1.405 ⎤ ⎦ ⎥ ⎥                            3 \times 4 ⟹ 1 N 1 3 ⎡ ⎣ ⎢ ⎢ 0.175 - 0.825 0.096 0.175 0.175 - 0.904 - 0.825 0.175 0.096 1 / 2.104 1 / 2.104 1 / 1.405 ⎤ ⎦ ⎥ ⎥                            3 \times 4 = dx \equiv [\partial L i j \partial x i l]

在上述的过程中，我们得到经过Softmax函数处理过的”新得分矩阵”

Sij ，并且令其中每张样本图片(每行)对应于正确标签的得分都减一，再配以系数1/N之后，就得到了损失函数关于输入矩阵z的“梯度矩阵” dz。严格的说，我们在 softmax_loss(z, y) 函数中输出的shape为(N, C)的 dz 矩阵变量对应的是

dLij/dzil 。

小结一下：

在我们定义的 softmax_loss(z, y) 函数中，不仅对神经网络的输出层给出的得分矩阵z给出了一个最终打分 loss——即损失函数，同时还输出了一个和得分矩阵z相同shape的散度矩阵 dz，代表的是损失函数关于得分矩阵z的梯度：根据 ∂Lij∂zij=1N(Sij−1);∂Lij∂zil=1NSil;(l≠yi) ，有：

[\partial L i j \partial z i l] \Leftrightarrow ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ \partial L 0 0 \partial z 00 \partial L 1 y 0 \partial z 1 y 0 \dots \dots \dots \dots \partial L i y i \partial z y i \dots \partial L 0 y i \partial z 0 y i \partial L 1 j \partial z 1 j \dots \dots \dots \dots \partial L i j \partial z i j \dots \dots \dots \dots \dots ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥                          N \times C \Leftrightarrow 1 N ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ S 00 S 1 y 0 - 1 \dots \dots \dots \dots S i y j - 1 \dots S 0 y i - 1 S 1 j \dots \dots \dots \dots S i j \dots \dots \dots \dots \dots ⎤ ⎦ ⎥ ⎥ ⎥ ⎥                            N \times C \Rightarrow dz

可以看到这个损失函数的梯度矩阵 dz 会得出每张样本图片(每行)的每个标签(每列)下输出层输出数据的得分梯度，亦即我们得到的是损失函数关于输出层得分的变化率 ∂L/∂z （后文用 ∂L/∂z 表示损失函数关于输出层神经元得分数据的梯度，用 ∂L/∂x,∂L/∂y 表示损失函数关于隐藏层神经元输出数据的梯度）。然而，我们的故事还远没有说完，回忆一下！我们需要的可是损失函数关于神经网络中所有参数(W, B)的变化率啊！(即 ∂L/∂W,∂L/∂B ) 然后我们才能不断通过损失函数 L 的反馈来调整神经网络中的参数(W, B)。

那么究竟该如何把损失函数关于输出层得分的变化率 ∂L/∂z 与损失函数关于神经网络中参数(W, B)的变化率 ∂L/∂W,∂L/∂B 建立起联系呢？这时候，传说中的反向传播终于要登场了！

链式的反向传播！

目前，我们已经将损失函数 L 与输出层输出数据矩阵的每一个得分建立起了联系。只要最后我们能算得出损失函数的值，就说明我们已经获得输出层的输出数据，进而就能得到损失函数关于输出层输出数据的梯度 ∂L/∂z 。

那么该如何进一步得到损失函数关于其他隐藏神经元层的输出数据的梯度 ∂L/∂x 呢？还有其关于每一隐藏层的参数数据的梯度 ∂L/∂W,∂L/∂B 呢？这时候就要感谢一下伟大的莱布尼兹，感谢他发明复合函数的微积分求导“链式法则”就是传说中的反向传播算法的核心基础。

废话少说，看图说话，故事还是要先从一个神经元说起：

图中正中的函数f相当于输出层的某一个神经元。绿色箭头代表的是得分数据的前向传播 f(x,y)=z （可以看到输出层正向来的数据 x,y 被”激活”过，流出输出层的数据 z 并没有考虑”激活“），红色箭头即代表的是梯度的反向传播。图中右侧的 ∂L/∂z 表示损失函数 L 关于输出层中来自当前神经元的数据得分 z 的梯度(scalar)。以上都是我们已知的，而我们未知且想知道的是损失函数 L 关于最后一隐藏层中流入当前神经元的数据得分 x 和 y 的梯度，即 ∂L/∂x,∂L/∂y 。

链式法则给我们提供了解决方案，那就是通过“局部梯度”将损失函数的梯度传递回去：

\partial L \partial x = \partial L \partial z \partial z \partial x; \partial L \partial y = \partial L \partial z \partial z \partial y

在反向传播的过程中，我们只需要给出上面蓝色公式所代表的局部梯度 ∂z/∂x,∂z/∂y ，即可从损失函数 L 关于输出层输出数据 z 的梯度 ∂L/∂z 得到 L 关于上一隐藏层输出数据 x,y 的梯度 ∂L/∂x,∂L/∂y 。如此一来，只要我们在每一层神经元处都定义好了局部梯度，就可以很轻松的把损失函数 L 关于该层神经元们输出数据的梯度”搬运”到该层神经元们输入数据的梯度，如此反复迭代，就实现了传说中的反向传播。。。

关于反向传播的故事还有一点没说完：对损失函数的 L 全微分不仅会涉及每层神经元给出的得分的微分，也会牵扯到该层参数(w, b)的微分，如此一来就可以得到我们想要的损失函数 L 关于神经网络模型参数(W, B)的梯度。

整个过程很像是 L 关于数据的梯度在每一层反向传播，顺便地把各层关于参数的梯度也算了出来。

是不是又被说晕了？不要急，直接上代码，最后奇迹立现！

def affine_backward(dout, cache):
    """ Computes the backward pass for an affine layer. Inputs: - dout: Upstream derivative, of shape (N, M) 上一层的散度输出 - cache: Tuple of: - z: Input data, of shape (N, d_1, ... d_k) - w: Weights, of shape (D, M) - b: biases, of shape (M,) Returns a tuple of: - dz: Gradient with respect to z, of shape (N, d1, ..., d_k) - dw: Gradient with respect to w, of shape (D, M) - db: Gradient with respect to b, of shape (M,) """
    z, w, b = cache
    dz, dw, db = None, None, None
    reshaped_x = np.reshape(z, (z.shape[0], -1))
    dz = np.reshape(dout.dot(w.T), z.shape)    # np.dot() 是矩阵乘法
    dw = (reshaped_x.T).dot(dout)
    db = np.sum(dout, axis=0)
    return dz, dw, db

代码详解：

我们定义 affine_backward(dout, cache) = (dz, dw, db) 函数来描述输出层神经元的反向传播。其中shape为(N, M)的 dout 矩阵就是损失函数 L 关于该层在 affine_forward() 函数正向输出数据 out 的梯度，其对应于我们上一节定义的 softmax_loss() 函数输出的 dz 矩阵。梯度在输出层反向传播的话，M的大小就等于样本图片的标签数，即 M=10 。cache 元组是正向流入输出层的神经元的数据x和输出层的参数(w, b)，即有 z, w, b = cache，其中输出层的输入数据z是未经过reshaped的一个多维array，shape为 (N,d1,…,dk) ，权重矩阵W的shape是(D, M)，偏置b的shape是(M, )。

接下来就是重点了！首先，在前向传播中，我们已经清楚该输出层神经元中数据的流动依据的是一个线形模型，即形如函数表达式 z(x,w,b）=xw+b 。找到函数 z 的局部梯度显然很简单：

\partial z \partial x = w, \partial z \partial w = x, \partial z \partial b = 1

进而，就可以有：(蓝色部分即为局部梯度！)

\partial L \partial x = \partial L \partial z \partial z \partial x = \partial L \partial z w, \partial L \partial w = \partial L \partial z \partial z \partial w = \partial L \partial z x, \partial L \partial b = \partial L \partial z \partial z \partial b = \partial L \partial z \cdot 1 .

然而，我们的“得分”函数可没这么简单，其是如下的一个矩阵表达式：

⎡ ⎣ ⎢ ⎢ z ⎤ ⎦ ⎥ ⎥      N \times M = \leftarrow ⎡ ⎣ ⎢ ⎢ x ⎤ ⎦ ⎥ ⎥      N \times D \cdot ⎡ ⎣ ⎢ ⎢ w ⎤ ⎦ ⎥ ⎥      D \times M + ⎡ ⎣ ⎢ ⎢ b ⎤ ⎦ ⎥ ⎥      N \times M Broadcasting

那么，这个矩阵表达式的局部梯度究竟该怎么写呢？通常，大家把故事讲到这里都是用”矩阵维度适配”的办法说明的，我们也会遵循主流，因为故事这样讲会很容易理解，也更方便应用。若想详细了解其中涉及的矩阵论知识，可参阅： cs231n， Wiki。

“矩阵维度匹配”到底是什么意思？这其实是个挺”猥琐”的方法，故事是这样的：

首先，我们要约定好所有损失函数 L 梯度的shape都要与其相关的矩阵变量的shape相同。比方说，上一节损失函数 softmax_loss(z, y) = (loss, dz) 中的梯度 dz 就和数据矩阵 z 的shape相同。所以，在函数 affine_backward(dout, cache) = (dz, dw, db) 中，我们就要求损失函数 L 关于正向输入矩阵(x, w, b)的梯度矩阵 (dx, dw, db) 与矩阵 (x, w, b) 维度相同。(严格说，我们的局部梯度求导其实对应于vector-by-vector derivatives，我们如此约定不过是相当于取定denominator layout)

于是，我们就可以按照上面函数 z 的局部梯度规则书写，只要保证矩阵表达式维度匹配即可：

⎡ ⎣ ⎢ ⎢ dx ⎤ ⎦ ⎥ ⎥      N \times 32 \times 32 \times 3 ⟸ np.reshape ⎡ ⎣ ⎢ ⎢ ⎢ dx^⎤ ⎦ ⎥ ⎥ ⎥      N \times D ⎡ ⎣ ⎢ ⎢ dw ⎤ ⎦ ⎥ ⎥      D \times M [\dots db \dots]          1 \times M = ⎡ ⎣ ⎢ ⎢ dout ⎤ ⎦ ⎥ ⎥        N \times M \cdot ⎡ ⎣ ⎢ ⎢ ⎢ w T ⎤ ⎦ ⎥ ⎥ ⎥      M \times D = ⎡ ⎣ ⎢ ⎢ ⎢ reshaped_x T ⎤ ⎦ ⎥ ⎥ ⎥              D \times N \cdot ⎡ ⎣ ⎢ ⎢ dout ⎤ ⎦ ⎥ ⎥        N \times M = [\dots 1 \dots]        1 \times N \cdot ⎡ ⎣ ⎢ ⎢

你可能感兴趣的:(斯坦福,李飞飞,公开课,公开课作业)

2022-10-20 体力劳动者
不因感觉稍纵即逝就不加记录。在女儿睡觉后我记下今天的小故事。接手新班级后，今天是第二次收到家长的感谢信（微信）。是我表扬次数最多的两位学生家长致来的感谢，他们明显感受到孩子自信、阳光了不少，写作业由被动变为了主动，家庭氛围也由鸡飞狗跳变成了其乐融融。在被顽皮的学生气得头晕之后，我感到了久违的价值感，责任感甚至使命感，我回复家长这样一句话：我们也需要家长的反馈好让我们的教育工作更有劲头。我也认识到，
与羊有关的诗句胡天寿01
1.《初春汉中漾舟》（孟浩然）羊公岘山下，神女汉皋曲。雪罢冰复开，春潭千丈绿。轻舟恣来往，探玩无厌足。波影摇妓钗，沙光逐人目。倾杯鱼鸟醉，联句莺花续。良会难再逢，日入须秉烛。2.《边头作》（李端）邠郊泉脉动，落日上城楼。羊马水草足，羌胡帐幕稠。射雕过海岸，传箭怯边州。事归朝将，今年又拜侯。3.《出境游山》(王勃)源水终无路，山阿若有人。羊先动石，走兔欲投巾。4.《按覆后归睦州，赠苗侍御》（刘长卿）
常规笔记本和加固笔记本的区别 luchengtech 电脑三防笔记本加固计算机加固笔记本
在现代科技产品中，笔记本电脑因其便携性和功能性被广泛应用。根据使用场景和需求的不同，笔记本可分为常规笔记本和加固笔记本，二者在多个方面存在显著区别。适用场景是区分二者的重要标志。常规笔记本主要面向普通消费者和办公人群，适用于家庭娱乐、日常办公、学生学习等相对稳定的室内环境。比如，人们在家用它追剧、处理文档，学生在教室用它完成作业。而加固笔记本则专为特殊行业设计，像军事、野外勘探、工业制造、交通运输
处于停机等非正常状态_设备非正常停机管理指导办法
设备非正常停机管理指导办法一、设备非正常停机的范围：1、维护、维修不良：未遵守设备维护及维修规程，导致维护、维修质量无法满足设备运行的技术、环境要求而造成的设备停机，例如：未按维护保养计划保养、维护质量不到位、违章检修，故障维修不彻底，润滑缺油或变质等。2、违章操作：未按照设备操作规程及作业文件等操作而造成的设备停机。3、设备点检缺失：是指设备操作者及维修人员未严格按照点检标准有效地对设备各部位进
3次创业身价百亿，2年前却被大众判“死刑”，李想如今怎样了？职心眼儿
他，19岁放弃高考去创业；25岁，成为亿万富豪，被央视评为“80后创业”领军人物；39岁，身价再次暴涨，一夜间闯过200亿大关。他，在3个领域连续创业20年，一家公司市值700亿，一家公司市值2000亿。而他的最高学历，却只有高中。这个人，就是理想汽车的创始人——李想。纵观李想的创业史，可谓是颇为传奇：一个既没背景，又没资金高中毕业生，怎么就让3位互联网巨头（张一鸣、王兴、程维）同时为自己站台？更
父母拼尽一切孩子却不领情？一定要学会这一招四叶草_add9
中原焦点团队李金梅坚持分享第601天2021.5.28中国的父母是世界上最累的父母，从孩子出生，他们就开始了操劳的父母生涯：孩子年幼时，照顾他的吃喝拉撒；孩子上学后，忙完工作回到家还要辅导孩子的功课，辅导不了要报辅导班；孩子长大成人了，父母仍然要操心孩子的工作和婚姻；孩子结婚的房子，父母帮着买；孩子生了孩子，父母帮着带……父母的大半生都把孩子排在自己前面，一切为了孩子，最后却往往落不着好：孩子要么
平凡与伟大--父亲的一生张翔淋
10.寻找四表哥先生要账还是没有结果，做工程，每到年关都会和农民工一起去要工程款。生活不易。从张家口东站下车的父亲下了车才知道离他四表哥的所在地张北县还有好几十里路，父亲背着随身携带的薄薄的一床被子，在没有路，一人高的杂草淀子里越走越迷路，实在找不着方向了，随身携带的被子也被换了吃的。身无分文，又累又饿的父亲只好去了难民登记处。登记员看见父亲带着的地址要找的人是张北县粮食局的李进替，非常高兴的告诉
黛玉葬花是一种什么心情爱的生命力
图片发自App小区里的花终于开了，带着孩子在小区散步的时候，无意间我注意到了玉兰，第一次我发现原来它是先开花后长叶子的，洁白如玉的花高耸入云，那种洁白，让人敬畏。因为有风，所以带孩子在楼遮挡的草坪上玩，发现紫叶李的花也开了，并且随着风的吹动，落了满地，孩子捡起一朵花，拿到我面前，细声细气的说“花”，我的大脑细胞瞬间激活，为什么不和孩子一起捡花呢！这可是一项好玩的游戏，于是我给孩子拿了一个大的挖土用
替身贵妃将我扒光沉塘，暴君杀红了眼陆知白李双儿全本免费小说阅读_最新完本小说替身贵妃将我扒光沉塘，暴君杀红了眼(陆知白李双儿) 多多文馆
《替身贵妃将我扒光沉塘，暴君杀红了眼》主角：陆知白李双儿简介：我是贫门农女，也是暴君爱而不得的白月光。为逼我入宫，他将我满村屠尽！暴君在后宫建了一座水晶殿，将我禁锢其中。他日日宠幸我，直至寻到一个与我七分相似的替身，方才淡了兴致。他将替身封为贵妃，千娇万宠一言可戏诸侯。贵妃恃宠生娇，趁着暴君出宫巡视，带着一群人闯进水晶殿。“本宫马上就要受封为后，今天就来清理后宫！”她在我脸上刻奴字，挑断我的手筋脚
新屋入伙柒月MissHuang
时隔7年了，2014-2021再次新屋入伙,感慨还是很大，最近总是收到很多小伙伴送来的礼物，或者是感人的信，自己也被自己感动和温暖突然想起老师的作业，编辑几个短信发给你想要感谢的人，多创造一些感动的时刻，时刻让自己开心和温暖，是的，就是要这股暖流，滋养自己感恩今天的到来，本来低调度过,但是还是收到很多小伙伴的祝福，感恩有你们
张长玲碎嘴惹闲气，郭德旺无心泄天机【三】南山顽石
玲玲便紧紧靠在他身边不情不愿地继续朝前走，一边走一双手却一边不太安分的在他身上摩挲起来。突然，她的一只手伸进了他的衣袋里，紧接着又出来，却已捏着个东西，口中欢叫起来：“啊！你有这，咋不早说？”瑞年朝她手上一看说：“气球嘛，有啥稀奇？”“你瓜呀！”玲玲笑道，“这是biyuntao，我在我大嫂子屋里见过的，想偷偷拿几个呢，又没好意思。”瑞年停下脚步问道：“啥是biyuntao？”李玲玲看他半日，把脸微
亲子日记第84篇宝贝儿快乐
今天下午把大宝接回来，犹豫我的牙痛，回来我就倒了一会，让他自己写的作业，这个小家伙没有我在旁边监督，写作业也懒散了，作业直接写了很长时间，我还在干着急，人家不急呀，什么时候不用督促就可以自己写作业了呀？
《应对焦虑》做好4点帮你轻松化解焦虑，并从焦虑中走出来程杰读书
你焦虑过吗？有被焦虑困扰过吗？那么什么是焦虑呢？焦虑就是对亲人或自己生命安全，前途命运等的过度担心，而产生的一种烦躁情绪。我曾经有一段时间也特别焦虑。那是在一年前由于孩子的数学成绩很差，思维跟不上。我经常辅导她，就是不开窍。把我气的心脏快炸了。怎么办呢？眼看就要上小学高年级了。心里那个着急啊，真的是无处可说。于是就在网校上报了名，让专业老师来辅导。可她对待作业都是马马虎虎，一点都不认真。眼看一学期
读书|日常听课最需要什么百草丰茂
今天继续阅读赵国忠老师主编的《听课最需要什么》第一章《日常听课最需要什么》的第2～4个建议。老师们有很多机会听课，学校教研、外出学习、公开课比武，有些老师听了很多课，却毫无收获；有的老师却从听课开始，逐步走上了专业成长的道路。我想肯定是因为有些老师还没有了解听课的需要，今天大家就和我一起来聆听一下优秀教师给我们的听课建议。一、听课要有备而来。在现实中，常常看见老师们特别是年轻的老师们，带着一支笔，
我的第一本书 - 草稿 2252张旭阳
我的第一本书第一段.我的第1本书是天地山出版社的《中国民间故事》，这是我妈妈给我买的书，在2022.8.13买的。第二段当时因为是在网课上说的，所以我让妈妈在网上买了下来，当时我对妈妈说：“语文老师，今天让我们买一本叫做中国民间故事的书。”妈妈说：“既然是老师的要求，我就给你买下来吧。”话音刚落，因为马要开始上数学的网课了，我当时就被母亲的话感动了，到了下午写完作业，我就拿了五块钱，去给母亲买了一
亲子日记702篇，九月十五号陈艺萱妈妈
开学已经两个多星期了，本来对担心孩子的英语了，没想到经过两个星期的学习，孩子对英语挺感兴趣的，还得说特别爱上英语课，英语课老师让他们玩游戏就学习了，学习一门新课，首先要提高孩子学习的兴趣，这个英语老师挺不错的。晚上检查完数学跟语文作业，我就看孩子开始学英语，我们一起给英语小视频配音，开始孩子有点紧张，我说没事，配的不好，咱们得重新配，让孩子多读几遍，没想到一次就成功了，我们来回回放，还在感觉特别新
李汶翰、徐娇领衔主演，杭州2022年亚运组委会授权电视剧《泳往直前》阵容官宣！楚离杜子腾
今日，杭州亚组委授权电视剧《泳往直前》阵容官宣，由黄克敏执导，李汶翰、徐娇领衔主演。《泳往直前》是亚运会筹备工作启动以来,着手谋划创作的亚运主题文艺精品项目之一，也是杭州亚组委官方授权拍摄的唯一一部亚运主题电视剧。《泳往直前》主要讲述了四名背景各异，独具个性的少年在泳池奋力拼搏、执着追梦的故事。中年失意的游泳教练梁友光，为了证明自己的能力，四处挖掘游泳的好苗子冲刺亚运会，在发现了毫无训练经验却颇有
写完作业的感觉很爽乡村算卦师
今天终于一口气把一个数据分析课的作业写完了。明天还要继续写一个，写完，就可以暂时轻松一下了。想想还是很开心的，哈哈哈。刚出去跑了一圈，结果下雨了，虽然不是很大，可是没办法跑，怕下大。现在在小区门口，吹吹风，也是极好的。希望一些都变的越来越好，加油！
2019-10-25 铭宝酷妈
赶会了回到家孩爸拿了一堆赶会的票，我就盘算着只能今晚去，明天白天监考，晚上值班。后天依然监考，孩子去学习，晚上孩子到家得七点了，第二天还得上学。可是孩子回家后直说今天赶了不少作业，晚上不写了。我心里想:吃饱饭赶紧赶会去！可是人家要求先玩半小时游戏。我趁机加码了两分英语试卷的选择题，他很快完成，顺利拿到手机。我跟孩爸没了耐心，就说那就不去了！结果人家玩完半小时没有还手机的意思！我暗使眼色，孩爸心知肚
一地鸡毛—一个中年男人的日常2021241 随止心语所自欲律
2021年8月31日，星期二，阴有小雨。早起5:30，跑步10公里。空气清新，烟雨朦胧，远山如黛，烟雾缭绕，宛若仙境。空气中湿气很大，朦胧细雨拍打在脸上，甚是舒服，跑步的人明显减少。早上开会，领导说起逐年大幅度下滑的工作业绩，越说越激动，说得脸红脖子粗。开完会又讨论了一下会议精神，心情也有波动，学习热情不高。心里还有一个大事，是今日大数据分析第1次考试，因自己前期没学，而且计算机编程方面没有任何基
2020-12-10 生活有鱼_727f
今日汇总：1.学习了一只舞蹈2.专业知识抄了一遍3.讲师训作业完成今日不足之处：1.时间没管理好，浪费了很多时间到现在才做完明日必做：1.讲师训作业完成2.群消息做好笔记3.宽带安装
假期过半，总结一下最近的自己逍遥洪七公
今天是10月3号了，假期已经过半。这几天哪里也没有去，就是在家里原地过节。每天都有一点琐碎的事情，都足以影响我的心绪。心绪不平，心乱如麻，就做不好事情。更别提外出旅游了。我就是在闲杂的事情里，度过每一天的。回头一看，也没有做什么，时间也走完了。原来想着利用假期，读一读书。听一听课。我在老师的指导下，一步一步地，写出了一篇文章。老师批改了作业，但是评语十分简单，没有修改我写的任何一个句子。只是在结尾
【208】《班级管理课》读书感悟（一百零五）2023-07-23 南风如我意
-----------《班级管理课》读书感悟四文/李现风2023年读书笔记读书笔记以以下三个出发点为目的：一、书中的思想，提升自己的教育理念；二、书中的值得借鉴的做法，提升自己的教育技巧；三、书中的美句，有鉴于哲理性的句子，提升自己文章的语言魅力和教育文化水准。读《班级管理课》作者陈宇读书感悟四：【书目】《班级管理课》【页数】第70页第87页【阅读内容（摘录）】第四课开学一个月：班级常规工作正常运
美言录1220-2018 面朝大海的虾米
宝贝，学校进入了复习阶段，功课作业对你来说有点多。我看到了你写作业时候非常的认真，作业的时间有点长，你有点累。可是你仍然一直在坚持，太不容易了。你昨天晚上，坚持就把笔头作业全部写完，没有留到早上写，有很大的进步哦！妈妈看到了，为你点个赞❤
我的青春不打烊｜（5）开学第一天静子木
点完名，班主任老师说：“今天是开学第一天，我们先大扫除，打扫教室。这样，先按现在同学们坐来分配，第一组负责打扫教室内外；第二组负责擦桌，门，窗。第三组负责提水，第四组负责冲洗教室。”同学们说：“好。”然后各组的人开始行动，因为是刚进初中，对一切都很陌生，还有点怯怯的样子。李诺和朱荣儿她们在第一组，所以她们去拿扫帚，开始扫地。这些事，平常在家都有做，她们做起来得心应手。人多力量大，每个人都很认真，有
2018-04-30 星期一晴 232 丽娜_550e
昨天累着起床有点晚！起床后儿子看见儿子已经穿戴整齐安静的看着电视。真是一个懂事的好孩子。问起儿子中午想吃什么？儿子答到红烧肉，让儿子抓紧时间写他的作业，昨天回老家估计也没有写！跟儿子说等你写完，自己的饭也就做好。焖上米饭看看时间十点多了拿出肉切成块。在手机上找了一个红烧肉做法，照着步骤去做，正好儿子写完我也做完。让儿子评价自己做的怎样？儿子用筷子尝后说好！自己再做个蘑菇汤便开始吃饭，红烧肉色香在那
智慧作业三年级周长袁缘
四、我会解决。把一张长24分米、宽16分米的大长方形纸板剪成4张同样大小的小长方形纸板，每个小长方形的周长是多少分米?解析：根据题意和上图可知：把一张长24分米、宽16分米的大长方形纸板剪成4张同样大小的小长方形纸板，就是把这块长方形纸板平均分成4份，也就是把它的长平均分成了4份,每份的长度变成了小长方形的宽,可以用除法计算出它的长度,24÷4=6(分米);仔细看图可知，大长方形纸板的的宽16分米
【20190316】《超级运营人》第2课《转化率》学习复盘+作业！艾宏的阳光部落
说到产品运营，需要把握产品和运营两个方向，产品包括萌芽期、成长期、成熟期和衰退期四个周期，而运营是与用户联系的，运营有金三角模型，包括产品、用户和渠道三个方面，最终实现产品的盈利和转化。萌姐给我们讲了客流量的五步流程，获取客户的几种途径，那今天萌姐将给我们带来转化率——运营硬本领之转化率能力构建五大硬本领能力构建，接下来说一下我的收获。一、课程记录：1、转化率概念：在特定时间内运营、推广行为实现目
第六天作业宇宇妈妈_e088
对换框法中的“二者兼得”的理解和认识。二者兼得：无论我面对怎样的情况，无论选择是多么的困难，我都努力的去让更多的可能出现，我要始终去思考，怎样才能够更全面，怎样都会达到我想要的，我要灵活的去做，我要有效的去努力，我要坚持的去付出。如果没有达到我想要的，我要不断去检视我自己，我的思维是否灵活我是否去行动了，我的方法是否有效，我是否够努力，我的行动是否坚持，我是否够付出当您深刻感悟到了“二者兼得”背后
老师的梦想〈小蚊子的奇思妙想日记〉柳梢晓月
上课时，二哥突然转过头对我说：“老师现在面对着黑板写字，我要帮忙实现老师的梦想！”我对二哥说：“是什么梦想呢？”二哥连忙说：“这你都不知道？我在办公室里偷听了老师的对话！我们语文老师的梦想就是当一个霸气女王！我要帮她实现她的愿望，说不定可以免作业！”我想了想，可以免作业！我连忙赞同了二哥的想法，并等着二哥的好消息！二哥趁着语文老师正在面对黑板写板书，她连忙从鼻子里抠出七个体型大小刚刚好的卡哇伊葫芦
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro