DUTBenjamin

深度学习3——神经网络与反向传播

一、多层感知机

1.1 单层感知机

1943年，麦卡洛克和皮兹提出MCP模型，开启了人工神经网络的大门。该模型模拟人的神经元反应过程，对输入信号进行线性加权、求和后，再通过非线性激活（阈值法）输出。其数学表达式为：
$y=f\left(\sum_{i=1}^{n} w_{i} x_{i}+b\right)$
其中， $x_i$ 是输入信号， $w_i$ 是对应的权重， $b$ 是偏置， $f$ 是激活函数。

假设一个简单的单层感知机，有两个输入 $x_1 = 2$ ， $x_2 = 3$ ，权重 $w_1 = 0.5$ ， $w_2 = 0.3$ ，偏置 $b = 1$ ，激活函数采用单位阶跃函数（当输入大于0时输出为1，否则为0）。先计算线性组合：
$z = w_1x_1 + w_2x_2 + b = 0.5×2 + 0.3×3 + 1 = 2.9$
由于 $z > 0$ ，经过激活函数后输出 $y = 1$ 。

1.2 神经网络

神经网络由多个神经元构成，各神经元具有不同的权重和偏置，这些权重和偏置是网络需要学习的参数。多个单层感知机组合在一起，就形成了神经网络。以一个简单的包含两个隐藏层的神经网络为例，输入层有两个神经元接收输入信号，隐藏层分别有三个和两个神经元，输出层有一个神经元。每个神经元都按照单层感知机的方式进行计算，前一层的输出作为后一层的输入，从而实现复杂的非线性映射。

1.3 激活函数

常见的激活函数有ReLU、LeakyReLU、PReLU和ELU等。

ReLU函数： $\begin{cases}x & x \geq 0 \\ 0 & x<0\end{cases}$
例如，当 $x = 3$ 时， $R e LU (3) = 3$ ；当 $x = - 2$ 时， $R e LU (- 2) = 0$ 。
LeakyReLU函数： $\begin{cases}x & if x>0 \\ \gamma x & if x \leq 0\end{cases} =max (0, x)+\gamma min (0, x)$
通常 $\gamma$ 取一个较小的值，如0.01。当 $x = 5$ 时， $L e ak y R e LU (5) = 5$ ；当 $x = - 4$ 时， $L e ak y R e LU (- 4) = 0.01 \times (- 4) = - 0.04$ 。
PReLU函数： $PReLU_{i}(x) = \begin{cases}x & if x>0 \\ \gamma_{i} x & if x \leq 0\end{cases} =max (0, x)+\gamma_{i} min (0, x)$
与LeakyReLU类似，但每个神经元可以有不同的 $\gamma_i$ 值。
ELU函数： $\begin{cases}x & if x>0 \\ \gamma(exp (x)-1) & if x \leq 0\end{cases} =max (0, x)+min (0, \gamma(exp (x)-1))$
当 $x = 2$ 时， $E LU (2) = 2$ ；当 $x = - 1$ ，若 $\gamma = 1$ ，则 $ELU(-1)=1×(e^{-1}-1)\approx -0.632$ 。

这些激活函数具有计算高效、符合生物学合理性、单侧抑制和宽兴奋边界的特点，在一定程度上能缓解梯度消失问题。如果神经网络中不使用非线性激活函数，即便增加更多隐藏层，在数学上也等价于一个单层感知机，无法学习复杂的非线性关系。

二、前馈神经网络

2.1 人工神经网络

人工神经网络主要由大量神经元及其之间的有向连接构成，构建时需要考虑三方面：神经元的激活规则，即输入到输出的非线性映射关系；网络的拓扑结构，也就是不同神经元之间的连接关系；学习算法，用于通过训练数据学习神经网络的参数。

2.2 前馈全连接神经网络

前馈全连接神经网络是人工神经网络的一种形式。其特点是各神经元分别属于不同层，层内无连接，相邻两层之间的神经元全部两两连接（全连接），整个网络中无反馈，信号从输入层向输出层单向传播（前馈）。

以一个简单的前馈全连接神经网络为例，输入层有3个神经元，隐藏层有4个神经元，输出层有2个神经元。输入层的每个神经元都与隐藏层的4个神经元相连，隐藏层的每个神经元又都与输出层的2个神经元相连。假设输入向量 $x = [x_1, x_2, x_3]^T$ ，输入层到隐藏层的权重矩阵 $W^{[1]}$ 是一个 $4 \times 3$ 的矩阵，偏置向量 $b^{[1]}$ 是一个4维向量，隐藏层到输出层的权重矩阵 $W^{[2]}$ 是一个 $2 \times 4$ 的矩阵，偏置向量 $b^{[2]}$ 是一个2维向量。通过前馈计算，可以得到输出结果。

2.3 逻辑回归模型

逻辑回归模型的公式为：
$\left.\begin{array}{c} x \\ w \\ b \end{array}\right\} \to z=w^{T} x+b \to \hat{y}=\sigma(z) \to L(\hat{y}, y)$
其中， $x$ 是输入特征向量， $w$ 是权重向量， $b$ 是偏置， $z$ 是线性组合的结果， $\sigma(z)$ 是sigmoid激活函数，用于将 $z$ 的值映射到 $(0, 1)$ 区间，得到预测值 $\hat{y}$ ， $L(\hat{y}, y)$ 是损失函数，用于衡量预测值与真实值 $y$ 之间的差异。

假设输入 $x = [1, 2]^T$ ， $w = [0.3, 0.4]^T$ ， $b = 0.1$ ，先计算 $z = w^Tx + b = 0.3×1 + 0.4×2 + 0.1 = 1.2$ ，再通过sigmoid函数 $\sigma(z)=\frac{1}{1 + e^{-z}}$ ，可得 $\hat{y}=\frac{1}{1 + e^{-1.2}}\approx0.777$ 。

2.4 神经网络模型

神经网络模型中涉及多个记号： $l$ 表示神经网络的层数； $M_l$ 表示第 $l$ 层神经元的个数； $f_l(\cdot)$ 表示第 $l$ 层神经元的激活函数； $W^{(l)} \in \mathbb{R}^{M_{l} ×M_{l-1}}$ 是第 $l - 1$ 层到第 $l$ 层的权重矩阵； $b^{(l)} \in \mathbb{R}^{M_{l}}$ 是第 $l - 1$ 层到第 $l$ 层的偏置； $z^{(l)} \in \mathbb{R}^{M_{l}}$ 是第 $l$ 层神经元的净输入（净活性值）； $a^{(l)} \in \mathbb{R}^{M_{l}}$ 是第 $l$ 层神经元的输出（活性值）。

以前馈神经网络的第一层为例，假设有输入 $x = [x_1, x_2, x_3]^T$ ，权重矩阵 $W^{[1]}$ 的第一列 $w_1^{[1]} = [w_{11}^{[1]}, w_{21}^{[1]}, w_{31}^{[1]}]^T$ ，偏置 $b_1^{[1]}$ ，则第一个神经元的净输入为：
$z_{1}^{[1]}=w_{11}^{[1]} x_{1}+w_{21}^{[1]} x_{2}+w_{31}^{[1]} x_{3}+b_{1}^{[1]}=\left(w_{11}^{[1]}, w_{21}^{[1]}, w_{31}^{[1]}\right)\left(\begin{array}{c}x_{1} \\ x_{2} \\ x_{3}\end{array}\right)+b_{1}^{[1]}=w_{1}^{[1] T} x^{[0]}+b_{1}^{[1]}$
经过激活函数 $f_1$ 后得到输出 $a_{1}^{[1]} = f_1(z_{1}^{[1]})$ 。

2.5 前馈计算—信息向前传递

前馈计算的过程为：
$z^{(l)}=W^{(l)} a^{(l-1)}+b^{(l)},$
$a^{(l)}=f_{l}\left(z^{(l)}\right).$
$x=a^{(0)} \to z^{(1)} \to a^{(1)} \to z^{(2)} \to \cdots \to a^{(L-1)} \to z^{(L)} \to a^{(L)}=\phi(x ; W, b)$
其中， $x$ 是输入， $W$ 和 $b$ 是网络参数， $L$ 是网络的层数。

假设有一个3层的前馈神经网络，输入 $x = [1, 2, 3]^T$ ，第一层权重矩阵 $W^{[1]}$ 、偏置 $b^{[1]}$ ，第二层权重矩阵 $W^{[2]}$ 、偏置 $b^{[2]}$ ，第三层权重矩阵 $W^{[3]}$ 、偏置 $b^{[3]}$ 。先计算第一层的净输入 $z^{[1]} = W^{[1]}x + b^{[1]}$ ，经过激活函数得到 $a^{[1]} = f_1(z^{[1]})$ ；然后将 $a^{[1]}$ 作为第二层的输入，计算 $z^{[2]} = W^{[2]}a^{[1]} + b^{[2]}$ ，再经过激活函数得到 $a^{[2]} = f_2(z^{[2]})$ ；最后计算第三层的 $z^{[3]} = W^{[3]}a^{[2]} + b^{[3]}$ ，经过激活函数得到最终输出 $a^{[3]} = f_3(z^{[3]})$ 。

2.6 通用近似定理

通用近似定理表明，令 $\varphi(\cdot)$ 是一个非常数、有界、单调递增的连续函数， $I_d$ 是一个 $d$ 维的单位超立方体 $0,1]^d$ ， $C(I_d)$ 是定义在 $I_d$ 上的连续函数集合。对于任何一个函数 $\in C(I_d)$ ，存在一个整数 $m$ ，和一组实数 $v_i$ ， $b_i \in \mathbb{R}$ 以及实数向量 $w_i \in \mathbb{R}^d$ ， $\cdots, m$ ，可以定义函数：
$F(x)=\sum_{i=1}^{m} v_{i} \varphi\left(w_{i}^{T} x+b_{i}\right)$
作为函数 $f$ 的近似实现，即：
$|F(x)-f(x)|<\epsilon, \forall x \in \mathcal{I}_{d}$
其中 $\epsilon>0$ 是一个很小的正数。这意味着具有线性输出层和至少一个使用“挤压”性质激活函数的隐藏层的前馈神经网络，只要隐藏层神经元数量足够，就可以以任意精度近似任何定义在实数空间中有界闭集的函数。

2.7 Deep is better

在图像分类任务中，深度神经网络表现出了优异的性能。例如，AlexNet（2012）、VGG（2014）、GoogleNet（2014）和Residual Net（2015）等网络结构，随着网络深度的增加，在图像分类任务上的错误率逐渐降低。如152层的特殊结构网络，错误率可低至3.57%，而较浅的网络错误率相对较高，这充分说明了深度神经网络在处理复杂图像分类任务时的优势。

2.8 深度神经网络

深度神经网络具有许多隐含层，通过这些隐含层可以自动学习数据的多层次特征表示。在图像分类中，浅层网络可能只能学习到图像的边缘、颜色等简单特征，而深层网络可以逐渐学习到更复杂的特征，如物体的形状、纹理以及它们之间的空间关系等，从而提高分类的准确性。

三、梯度反向传播

3.1 全连接网络

3.1.1 参数学习

给定训练集为 $D={(x^{(n)}, y^{(n)})}_{n=1}^{N}$ ，将每个样本 $x^{(n)}$ 输入给前馈神经网络，得到网络输出为 $\hat{y}^{(n)}$ ，其在数据集 $D$ 上的损失函数为：
$\mathcal{R}(W, b)=\frac{1}{N} \sum_{n=1}^{N} \mathcal{L}\left(y^{(n)}, \hat{y}^{(n)}\right)+\frac{1}{2} \lambda\| W\| _{F}^{2}$
其中， $\mathcal{L}\left(y^{(n)}, \hat{y}^{(n)}\right)$ 是单个样本的损失函数， $\lambda$ 是正则化参数，用于防止过拟合， $W\| _{F}^{2}$ 是权重矩阵 $W$ 的Frobenius范数。通过梯度下降法更新参数：
$W^{(l)} \leftarrow W^{(l)}-\alpha \frac{\partial \mathcal{R}(W, b)}{\partial W^{(l)}}$
$b^{(l)} \leftarrow b^{(l)}-\alpha \frac{\partial \mathcal{R}(W, b)}{\partial b^{(l)}}$
其中， $\alpha$ 是学习率，控制参数更新的步长。

假设一个简单的全连接网络，有两个样本 $x^{(1)}, y^{(1)})$ 和 $x^{(2)}, y^{(2)})$ ，损失函数为均方误差损失 $\mathcal{L}\left(y^{(n)}, \hat{y}^{(n)}\right)=\frac{1}{2}(y^{(n)} - \hat{y}^{(n)})^2$ ，权重矩阵 $W$ 是一个 $2 \times 3$ 的矩阵，偏置向量 $b$ 是一个2维向量， $\lambda = 0.1$ ， $\alpha = 0.01$ 。先计算损失函数 $\mathcal{R}(W, b)$ ，再分别计算 $\frac{\partial \mathcal{R}(W, b)}{\partial W}$ 和 $\frac{\partial \mathcal{R}(W, b)}{\partial b}$ ，最后按照梯度下降公式更新 $W$ 和 $b$ 。

3.1.2 梯度下降

梯度下降类似于盲人下山，通过不断沿着梯度的反方向调整网络参数，使得损失函数逐渐减小。对于神经网络这个复杂的复合函数，其梯度计算基于链式法则。例如，对于复合函数 $y=f^{5}\left(f^{4}\left(f^{3}\left(f^{2}\left(f^{1}(x)\right)\right)\right)\right)$ ，其对 $x$ 的导数为：
$\frac{\partial y}{\partial x}=\frac{\partial f^{5}}{\partial f^{4}} \frac{\partial f^{4}}{\partial f^{3}} \frac{\partial f^{3}}{\partial f^{2}} \frac{\partial f^{2}}{\partial f^{1}} \frac{\partial f^{1}}{\partial x}$

3.1.3 链式法则

链式法则是微积分中求复合函数导数的常用方法：

若 $\in \mathbb{R}$ ， $\in \mathbb{R}^{s}$ ， $\in \mathbb{R}^{t}$ ，则：
$\frac{\partial g}{\partial x}=\frac{\partial u}{\partial x} \frac{\partial g}{\partial u} \in \mathbb{R}^{1 × t}$
若 $\in \mathbb{R}^{p}$ ， $\in \mathbb{R}^{s}$ ， $\in \mathbb{R}^{t}$ ，则：
$\frac{\partial z}{\partial x}=\frac{\partial y}{\partial x} \frac{\partial z}{\partial y} \in \mathbb{R}^{p × t}$
若 $\in \mathbb{R}^{p ×q}$ 为矩阵， $\in \mathbb{R}^{s}$ ， $\in \mathbb{R}$ ，则：
$\frac{\partial z}{\partial X_{i j}}=\frac{\partial y}{\partial X_{i j}} \frac{\partial z}{\partial y} \in \mathbb{R}$

假设函数 $z = (x^2 + 1)^3$ ，令 $u = x^2 + 1$ ，则 $z = u^3$ 。根据链式法则， $\frac{\partial z}{\partial x}=\frac{\partial z}{\partial u}\frac{\partial u}{\partial x}$ ， $\frac{\partial z}{\partial u}=3u^2$ ， $\frac{\partial u}{\partial x}=2x$ ，所以 $\frac{\partial z}{\partial x}=3(x^2 + 1)^2×2x = 6x(x^2 + 1)^2$ 。

3.2 反向传播算法

反向传播算法是根据前馈网络的特点设计的高效计算梯度的方法。以一个简单的神经网络为例，包含输入层、一个隐藏层和输出层，假设网络的输出为 $\hat{y}$ ，损失函数为 $\hat{y})$ ，其中 $y$ 是真实标签。

设输入层有 $n$ 个神经元，隐藏层有 $m$ 个神经元，输出层有 $k$ 个神经元。输入向量为 $[x_1, x_2, \cdots, x_n]^T$ ，输入层到隐藏层的权重矩阵为 $W^{(1)} \in \mathbb{R}^{m \times n}$ ，偏置向量为 $b^{(1)} \in \mathbb{R}^{m}$ ；隐藏层到输出层的权重矩阵为 $W^{(2)} \in \mathbb{R}^{k \times m}$ ，偏置向量为 $b^{(2)} \in \mathbb{R}^{k}$ 。

前馈计算过程如下：
隐藏层的净输入： $z^{(1)} = W^{(1)}x + b^{(1)}$
隐藏层的输出： $a^{(1)} = f_1(z^{(1)})$ ，其中 $f_1$ 是隐藏层的激活函数
输出层的净输入： $z^{(2)} = W^{(2)}a^{(1)} + b^{(2)}$
输出层的输出： $\hat{y} = a^{(2)} = f_2(z^{(2)})$ ，其中 $f_2$ 是输出层的激活函数

反向传播的目标是计算损失函数 $\hat{y})$ 关于权重和偏置的梯度，即 $\frac{\partial L}{\partial W^{(1)}}$ 、 $\frac{\partial L}{\partial b^{(1)}}$ 、 $\frac{\partial L}{\partial W^{(2)}}$ 和 $\frac{\partial L}{\partial b^{(2)}}$ 。

步骤 1：计算输出层的误差 $\delta^{(2)}$

$\delta^{(2)} = \frac{\partial L}{\partial z^{(2)}} = \frac{\partial L}{\partial \hat{y}} \odot f_2'(z^{(2)})$
其中， $\odot$ 表示逐元素相乘， $f_2'(z^{(2)})$ 是输出层激活函数的导数。

假设损失函数为均方误差损失 $\hat{y}) = \frac{1}{2} \sum_{i=1}^{k} (y_i - \hat{y}_i)^2$ ，则 $\frac{\partial L}{\partial \hat{y}} = \hat{y} - y$ 。若输出层激活函数为 sigmoid 函数 $f_2(z) = \frac{1}{1 + e^{-z}}$ ，其导数为 $f_2'(z) = f_2(z)(1 - f_2(z))$ 。

例如，设 $y = [0, 1]^T$ ， $\hat{y} = [0.2, 0.8]^T$ ， $z^{(2)} = [1, 2]^T$ ， $f_2(z^{(2)}) = [0.731, 0.881]^T$ ， $f_2'(z^{(2)}) = [0.197, 0.105]^T$ ，则：
$\frac{\partial L}{\partial \hat{y}} = [0.2 - 0, 0.8 - 1]^T = [0.2, -0.2]^T$
$\delta^{(2)} = [0.2, -0.2]^T \odot [0.197, 0.105]^T = [0.0394, -0.021]^T$

步骤 2：计算隐藏层的误差 $\delta^{(1)}$

$\delta^{(1)} = \left(W^{(2)T} \delta^{(2)}\right) \odot f_1'(z^{(1)})$
其中， $W^{(2)T}$ 是权重矩阵 $W^{(2)}$ 的转置， $f_1'(z^{(1)})$ 是隐藏层激活函数的导数。

假设隐藏层激活函数为 ReLU 函数 $f_1(z) = \max(0, z)$ ，其导数为 $f_1'(z) = \begin{cases} 1, & z > 0 \\ 0, & z \leq 0 \end{cases}$ 。设 $W^{(2)} = \begin{bmatrix} 0.1 & 0.2 \\ 0.3 & 0.4 \end{bmatrix}$ ， $z^{(1)} = [0.5, -0.3]^T$ ，则 $f_1'(z^{(1)}) = [1, 0]^T$ 。
$W^{(2)T} \delta^{(2)} = \begin{bmatrix} 0.1 & 0.3 \\ 0.2 & 0.4 \end{bmatrix} \begin{bmatrix} 0.0394 \\ -0.021 \end{bmatrix} = \begin{bmatrix} -0.00236 \\ -0.00064 \end{bmatrix}$
$\delta^{(1)} = \begin{bmatrix} -0.00236 \\ -0.00064 \end{bmatrix} \odot [1, 0]^T = \begin{bmatrix} -0.00236 \\ 0 \end{bmatrix}$

步骤 3：计算梯度

$\frac{\partial L}{\partial W^{(2)}} = \delta^{(2)} (a^{(1)})^T$
$\frac{\partial L}{\partial b^{(2)}} = \delta^{(2)}$
$\frac{\partial L}{\partial W^{(1)}} = \delta^{(1)} x^T$
$\frac{\partial L}{\partial b^{(1)}} = \delta^{(1)}$

设 $a^{(1)} = [0.6, 0.7]^T$ ， $x = [0.1, 0.2]^T$ ，则：
$\frac{\partial L}{\partial W^{(2)}} = \begin{bmatrix} 0.0394 \\ -0.021 \end{bmatrix} \begin{bmatrix} 0.6 & 0.7 \end{bmatrix} = \begin{bmatrix} 0.02364 & 0.02758 \\ -0.0126 & -0.0147 \end{bmatrix}$
$\frac{\partial L}{\partial b^{(2)}} = \begin{bmatrix} 0.0394 \\ -0.021 \end{bmatrix}$
$\frac{\partial L}{\partial W^{(1)}} = \begin{bmatrix} -0.00236 \\ 0 \end{bmatrix} \begin{bmatrix} 0.1 & 0.2 \end{bmatrix} = \begin{bmatrix} -0.000236 & -0.000472 \\ 0 & 0 \end{bmatrix}$
$\frac{\partial L}{\partial b^{(1)}} = \begin{bmatrix} -0.00236 \\ 0 \end{bmatrix}$

步骤 4：更新参数

根据梯度下降法，更新权重和偏置：
$W^{(2)} \leftarrow W^{(2)} - \alpha \frac{\partial L}{\partial W^{(2)}}$
$b^{(2)} \leftarrow b^{(2)} - \alpha \frac{\partial L}{\partial b^{(2)}}$
$W^{(1)} \leftarrow W^{(1)} - \alpha \frac{\partial L}{\partial W^{(1)}}$
$b^{(1)} \leftarrow b^{(1)} - \alpha \frac{\partial L}{\partial b^{(1)}}$
其中， $\alpha$ 是学习率。假设 $\alpha = 0.01$ ，则更新后的参数为：
$W^{(2)}_{\text{new}} = W^{(2)} - 0.01 \times \begin{bmatrix} 0.02364 & 0.02758 \\ -0.0126 & -0.0147 \end{bmatrix}$
$b^{(2)}_{\text{new}} = b^{(2)} - 0.01 \times \begin{bmatrix} 0.0394 \\ -0.021 \end{bmatrix}$
$W^{(1)}_{\text{new}} = W^{(1)} - 0.01 \times \begin{bmatrix} -0.000236 & -0.000472 \\ 0 & 0 \end{bmatrix}$
$b^{(1)}_{\text{new}} = b^{(1)} - 0.01 \times \begin{bmatrix} -0.00236 \\ 0 \end{bmatrix}$

四、图像分类流程

4.1 数据准备

数据收集：收集大量的图像数据，这些图像应涵盖不同的类别，例如在猫狗分类任务中，需要收集猫和狗的图像。可以从公开数据集（如 ImageNet、CIFAR - 10 等）获取数据，也可以通过网络爬虫等方式自己收集。
数据标注：为每一张图像标注其所属的类别。例如，对于一张猫的图像，标注为“猫”这个类别。标注的准确性对模型的训练效果至关重要。
数据预处理：对收集到的图像进行预处理操作，包括：
- 归一化：将图像的像素值归一化到 [0, 1] 或 [-1, 1] 区间，例如将像素值除以 255 可以将像素值归一化到 [0, 1] 区间。假设图像的一个像素值为 128，则归一化后的值为 $128 \div 255 \approx 0.502$ 。
- 缩放：将所有图像调整为相同的尺寸，以便输入到神经网络中。例如，将所有图像都调整为 224×224 像素的大小。
- 数据增强：通过旋转、翻转、裁剪等方式增加数据的多样性，提高模型的泛化能力。例如，将图像随机水平翻转，原来在左边的物体就会出现在右边。

4.2 模型选择与构建

选择合适的模型架构：可以选择经典的神经网络架构，如 AlexNet、VGG、ResNet 等。例如，ResNet 通过引入残差块解决了深度神经网络训练过程中的梯度消失和梯度爆炸问题，能够训练更深的网络，从而学习到更复杂的特征。
构建模型：使用深度学习框架（如 PyTorch、TensorFlow 等）构建所选的模型。以 PyTorch 为例，构建一个简单的两层全连接神经网络的代码如下：

import torch
import torch.nn as nn

class SimpleNet(nn.Module):
    def __init__(self, input_size, hidden_size, num_classes):
        super(SimpleNet, self).__init__()
        self.fc1 = nn.Linear(input_size, hidden_size)
        self.relu = nn.ReLU()
        self.fc2 = nn.Linear(hidden_size, num_classes)

    def forward(self, x):
        out = self.fc1(x)
        out = self.relu(out)
        out = self.fc2(out)
        return out

# 示例参数
input_size = 784  # 假设输入图像是 28x28 像素的，展平后为 784 维向量
hidden_size = 500
num_classes = 10  # 假设是 10 分类任务

model = SimpleNet(input_size, hidden_size, num_classes)

4.3 模型训练

定义损失函数：根据具体的任务选择合适的损失函数，在图像分类任务中，常用的损失函数是交叉熵损失函数。对于多分类问题，交叉熵损失函数的公式为：
$\hat{y}) = - \sum_{i=1}^{C} y_i \log(\hat{y}_i)$
其中， $y$ 是真实标签的 one - hot 编码， $\hat{y}$ 是模型的预测概率分布， $C$ 是类别数。
定义优化器：选择合适的优化器来更新模型的参数，常用的优化器有随机梯度下降（SGD）、Adam 等。例如，使用 Adam 优化器的代码如下：

import torch.optim as optim

learning_rate = 0.001
optimizer = optim.Adam(model.parameters(), lr=learning_rate)

训练循环：将数据分成多个批次（batch），每个批次的数据输入到模型中进行前馈计算，得到预测结果，然后计算损失函数，再通过反向传播算法计算梯度，最后使用优化器更新模型的参数。训练过程通常会进行多个轮次（epoch），直到模型的性能达到满意的程度。

num_epochs = 10
batch_size = 64

for epoch in range(num_epochs):
    for i, (images, labels) in enumerate(train_loader):
        # 前馈计算
        outputs = model(images)
        loss = criterion(outputs, labels)

        # 反向传播和优化
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

    print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}')

4.4 模型评估

划分验证集和测试集：将收集到的数据划分为训练集、验证集和测试集。训练集用于训练模型，验证集用于在训练过程中评估模型的性能，调整模型的超参数（如学习率、批次大小等），测试集用于最终评估模型的泛化能力。
评估指标：使用合适的评估指标来评估模型的性能，常用的评估指标有准确率、精确率、召回率、F1 值等。例如，准确率的计算公式为：
$\text{Accuracy} = \frac{\text{正确预测的样本数}}{\text{总样本数}}$

4.5 模型部署

模型保存：将训练好的模型保存下来，以便后续使用。在 PyTorch 中，可以使用 torch.save() 函数保存模型的参数。

torch.save(model.state_dict(), 'model.pth')

部署模型：将保存的模型部署到实际应用中，例如开发一个图像分类的 Web 应用，用户上传一张图像，模型对其进行分类并返回结果。可以使用 Flask 等 Web 框架开发这样的应用。

综上所述，多层感知机、前馈神经网络、梯度反向传播算法以及图像分类流程构成了深度学习在图像分类领域的核心内容。通过不断地研究和改进这些技术，能够提高图像分类的准确性和效率，推动深度学习在更多领域的应用。

为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
神经形态计算如何突破冯·诺依曼架构限制？ AI算力网络与通信 AI人工智能与大数据技术 AI算力网络与通信原理 AI人工智能大数据架构架构 ai
神经形态计算如何突破冯·诺依曼架构限制？关键词：神经形态计算、冯·诺依曼架构、内存墙、存算一体、脉冲神经网络、类脑芯片、低功耗计算摘要：本文将从“冯·诺依曼架构的前世今生”讲起，用“图书馆管理员搬书”的生活案例类比其核心矛盾，再通过“人脑神经元工作模式”的比喻引入神经形态计算的核心原理。我们将一步步拆解冯·诺依曼架构的三大限制（内存墙、高功耗、非结构化数据处理弱），并对应解析神经形态计算的三大突破
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）九章云极AladdinEdu 空间计算神经网络人工智能 gpu算力算法 java 开发语言
一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
企业级RAG的数据方案选择 - 向量数据库、图数据库和知识图谱南七小僧 AI技术产品经理网站开发人工智能数据库知识图谱人工智能
如何为企业RAG选择合适的数据存储方式摘要:本文讨论了矢量数据库、图数据库和知识图谱在解决信息检索挑战方面的重要性，特别是针对企业规模的检索增强生成（RAG）。看看海外人工智能企业Writer是如何利用知识图谱增强企业级RAG。要点概要：矢量数据库高效存储数据，但缺乏上下文和关联信息。图数据库优先考虑数据点之间的关系，受益于关系结构。知识图谱在语义存储方面表现出色，由于其能够编码丰富的上下文信息，
【人工智能入门必看的最全Python编程实战（1）】 DFCED 人工智能 python 开发语言深度学习找工作就业
--------------------------------------------------------------------------------------------------------------------1.AIGC未来发展前景未完持续…1.1人工智能相关科研重要性拥有一篇人工智能科研论文及专利软著竞赛是保研考研留学深造以及找工作的关键门票！！！拥有一篇人工智能科研论文
基于深度学习的目标检测算法综述：从RCNN到YOLOv13，一文看懂十年演进！人工智能教程深度学习目标检测算法人工智能自动驾驶 YOLO 机器学习
一、引言：目标检测的十年巨变2012年AlexNet拉开深度学习序幕，2014年RCNN横空出世，目标检测从此进入“深度时代”。十年间，算法从两阶段到单阶段，从Anchor-base到Anchor-free，从CNN到Transformer，从2D到3D，从监督学习到自监督学习，迭代速度之快令人目不暇接。本文将系统梳理基于深度学习的目标检测算法，带你全面了解技术演进、核心思想、代表算法、工业落地与
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版）
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版））工业相机使用YoloV8模型实现不同水果的检测识别工业相机通过YoloV8模型实现不同水果的检测识别的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入Yo
2025毫米波雷达技术白皮书：智能汽车与物联网的感知核心
随着人工智能、物联网（IoT）和智能汽车产业的迅猛发展，毫米波雷达技术正成为感知领域的核心驱动力。毫米波雷达凭借其高精度、全天候和强抗干扰能力，广泛应用于智能汽车的自动驾驶、物联网的环境感知以及工业自动化。2025年，毫米波雷达技术在性能、应用场景和市场规模上都达到了一个全新的高度。本白皮书将深入探讨毫米波雷达技术的核心优势、发展趋势及其在智能汽车与物联网中的应用前景，同时推荐各大品牌的领先产品方
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
人工智能概念之九：深度学习概述
文章目录相关文章一、深度学习的定位：AI时代的基石技术1.1技术生态全景图1.2技术革命的催化剂二、深度学习的双面性：性能优势与技术挑战2.1技术优势全景扫描2.2技术挑战深度剖析三、技术演进时间轴：70年的厚积薄发四、主流框架生态对比五、未来演进方向相关文章人工智能概念之二：人工智能核心概念：网页链接一、深度学习的定位：AI时代的基石技术1.1技术生态全景图深度学习处于人工智能（AI）技术金字塔
基于AlexNet架构的卷积神经网络模型用于对胸部X光图像进行二分类（例如，诊断肺炎）
1.肺炎正常的胸部X线片描绘了清晰的肺部，图像中没有任何异常混浊的区域。正常的胸部X线片1.1细菌性肺炎临床表现细菌性肺炎通常由细菌引起，如肺炎链球菌、流感嗜血杆菌、肺炎克雷伯菌等。患者可能出现高热、寒战、咳嗽、咳痰（痰液可能呈脓性）、胸痛、呼吸困难等症状。影像学特征局灶性肺叶实变细菌性肺炎在影像学上常表现为肺叶或肺段的局灶性实变，即某一区域的肺组织因炎症而失去气体交换功能，呈现为高密度影。胸腔积
H800核心技术突破与行业应用实战智能计算研究中心其他
内容概要在人工智能技术持续迭代的背景下，H800芯片凭借自主架构优化与算力跃升，成为推动行业场景化落地的关键驱动力。本文将从技术路径、性能突破与行业应用三个维度，系统解析H800如何在高并发计算与低延时响应领域实现底层架构创新。首先聚焦其自主架构优化的核心技术路径，包括动态资源调度算法与异构计算单元的深度协同设计，揭示其在能效比与计算密度上的突破逻辑；进一步结合算力跃升的具体表现，探讨该芯片如何通
智慧建筑：科技引领房地产与建筑业的未来 RedPhoenix45
最新接入DeepSeek-V3模型，点击下载最新版本InsCodeAIIDE智慧建筑：科技引领房地产与建筑业的未来随着科技的飞速发展，人工智能（AI）和智能化工具正以前所未有的速度改变着各行各业。在房地产与建筑领域，这种变革尤为显著。从建筑设计到施工管理，再到物业管理，智能化技术正在重塑行业的每一个环节。本文将探讨如何利用先进的智能化工具提升房地产与建筑行业的效率，并介绍一款革命性的开发工具——它
学苑教育杂志《学苑教育》杂志社学苑教育编辑部2025年第21期目录 QQ296078736 人工智能
专题研究推进“教-学-评”一体化，打造小学语文高效课堂刘月兰;4-6教育管理新高考制度下普通高中生涯教育课程设计的研究霍亚贞;马玲;7-9课堂教学核心素养下小学数学深度学习课堂的构建策略康贵景;10-12“双减”背景下初中英语教学的课堂模式高燕;13-15小学低年级数学说理课堂构建策略玉洁;16-18基于法治观念培育的道法课项目式教学策略许静;19-21“双师课堂”在初中语文写作教学中的实践孙巧玲
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa