CoreJia

【MC-CNN论文翻译】Computing the Stereo Matching Cost with a Convolutional Neural Network

前言

没怎么找到这篇论文的完整版，于是自己完整翻译了这篇论文。
中间主要借助百度翻译，并且参考了一些他人已经翻译过的片段。
相关学术名词我尽可能标准翻译了，如还有不当之处，望指出。

Computing the Stereo Matching Cost with a Convolutional Neural Network

摘要

我们提取出了一种从矫正后的图像对提取深度信息的方法。我们训练一个卷积神经网络来预测两个图像块的匹配程度并计算立体匹配代价。匹配代价细化为基于交叉的代价聚合算法（cross-based cost aggregation）和半全局匹配算法（semiglobal matching），然后进行左右一致性检查（consistency check），消除遮挡区域的误差。我们的立体匹配算法在KITTI立体匹配数据集上实现2.61%的错误率，并且是该数据集上截止于2014年8月为止表现最好的算法。

1. 介绍

考虑下列问题：给定两个从不同水平位置拍摄的图像，目的是计算左图中每个像素点的视差 $d$ 。视差是指一个物体在左右图像中水平位置上的差距——左图中 $(x, y)$ 处的物体出现在右图中 $(x - d, y)$ 处。知道物体的视差 $d$ 后，我们能通过以下关系计算它的深度 $z$ （即物体到相机的距离）：
$z=\frac{fB}{d}， \tag{1}$
其中 $f$ 是相机的焦距， $B$ 是两个相机光心的距离。所描述的问题是三维重建的子问题，目标是从一个或多个图像中提取三维形状。根据Scharstein和Szeliski[14]的分类，典型的立体算法由四个步骤组成： $(1)$ 匹配代价计算； $(2)$ 代价聚合； $(3)$ 视差计算； $(4)$ 视差优化。根据Hirschmuller和Scharstein[5]，我们将步骤 $(1)$ 和 $(2)$ 称为计算匹配代价，步骤 $(3)$ 和 $(4)$ 称为立体方法。我们提出了在多对小图像块上训练一个卷积神经网络[9]，其中真实视差是已知的（例如通过激光雷达获得）。网络的输出用于初始化图像块对之间的匹配代价。匹配代价是通过采用基于交叉的代价聚合在具有相似灰度的邻近像素点之间融合而成。平滑约束（smoothness constraints）通过半全局匹配算法加强，左右一致性检查用于检测和消除遮挡区域的误差。我们进行了亚像素增强，并应用中值滤波和双边滤波获得最终的视差图。图1描述了方法的输入和输出。

图1 输入是来自左右摄像头的一对图像。物体在这两个输入图像上的水平位置上差别很大。注意距离相机较近的物体的视差比距离较远的物体视差大。输出中较暖的颜色代表较大的视差值，即较小的深度值。

本文的两个贡献是：

我们描述了卷积神经网络如何用于计算匹配代价。
我们在KITTI数据集上实现了2.61%的错误率，优于以前的最佳结果2.83%。

2. 相关工作

在大型数据集[2, 13]被引入之前，相对较少的立体匹配算法用基准真值（ground-truth）信息来学习模型的参数。在本节中，我们将回顾其中的一些算法。对立体匹配算法的概述参见[14]。Kong和Tao[6]的算法使用距离平方和来计算初始匹配代价。他们训练了一个预测三类概率分布的模型：初始视差正确，由于前景放大导致的初始视差错误，由于其他原因导致的视差错误。利用预测概率调整初始匹配代价。Kong和Tao[7]后来通过结合由计算不同窗口大小和中心的归一化相关匹配算法（normalized cross-correlation）获得的预测值，扩展了他们的工作。Peris等人[12]用AD-Census算法[11]初始化匹配代价，并使用多类线性鉴别分析（multiclass linear discriminant analysis）来学习从计算的匹配代价到最终视差的映射。

基准真值数据也被用来学习图形模型的参数。Zhang和Seitz[22]使用交替优化算法（alternative optimization algorithm）来估计Markov随机场（Markov random field）超参数的最优值。Scharstein和Pal[13]构建了一个由30对立体对组成的新数据集，并用它来学习条件随机场的参数。Li和Huttenlocher[10]提出了一种具有非参数代价函数的条件随机场模型（conditional random field model），并利用结构化支持向量机学习模型参数。

最近的工作[3, 15]侧重于估计计算出的匹配代价的置信度。Haeusler等人[3]使用随机决策树分类器组合多个置信度量。同样，Spyropoulos等人[15]训练了一个随机决策树分类器（a random forest classifier）来预测匹配代价的置信度，并将预测作为Markov随机场中的软约束，以减少立体方法的误差。

3. 匹配代价计算

一个典型的立体匹配算法是计算出考虑范围中的所有视差d在每个位置p的匹配成本C(p, d)。一个简单的例子是SAD（Sum of Absolute Differences，绝对差和）：
$C_{AD}(\textbf{p},d) = \sum_{\textbf{q}\in{\mathcal{N}_{\textbf{p}}}}|I^{L}(\textbf{q})-I^{R}(\textbf{qd})|， \tag{2}$
其中， $I^{L}(\textbf{q})$ 和 $I^{R}(\textbf{qd})$ 是左右图像位置点 $\textbf{p}$ 处的图像强度， $\mathcal{N}_{\textbf{p}}$ 是以 $\textbf{p}$ 为中心的固定矩形窗口的一组位置集。我们使用粗体小写 $(\textbf{p},\textbf{q},\textbf{r})$ 表示实数对。附加一个小写的 $\textbf{d}$ 的含义是：如果 $\textbf{p}=(x,y)$ ，那么 $\textbf{pd}=(x-d,y)$ 。

方程 $(2)$ 可以解释为计算左图中以 $\textbf{p}$ 为中心的图像块与右图中以 $\textbf{pd}$ 为中心的图像块的相关匹配代价。由于可以从公开数据集（如Kitti[2]和Middlebury[14]）中获取匹配结果好的样本和匹配结果差的样本，因此我们可以尝试通过有监督的学习方法来解决匹配问题。在卷积神经网络成功应用于视觉问题[8]的启发下，我们使用它们来评估两个图像块的匹配程度。

3.1 建立数据集

训练集包含两个图像块，分别来自左图和右图：
$<\mathcal{P}_{9×9}^{L}(\textbf{p}),\mathcal{P}_{9×9}^{R}(\textbf{q})>,\tag{3}$
其中， $\mathcal{P}_{9×9}^{L}(\textbf{p})$ 表示左图上以位置 $\textbf{p}=(x,y)$ 为中心的9×9图像块。当视差d已知的条件下，我们提取一个正样本和一个负样本。负样本的获得可通过设置右图像块的中心 $\textbf{q}$ 为
$\textbf{q}=(x-d+o_{neg},y), \tag{4}$
$o_{neg}$ 是破坏匹配的偏移量，随机选自集合 ${-N_{hi},...,-N_{lo}.N_{lo},...,N_{hi}\}$ 。同样的，正样本的获得可通过设置
$\textbf{q}=(x-d+o_{pos},y), \tag{5}$
$o_{pos}$ 随机选自集合 ${-P_{hi},...,P_{hi}\}$ 。将 $O_{pos}$ 包括在内，而不是设置为 $0$ 的原因与稍后使用的立体方法有关。特别的，我们发现当网络将低匹配代价分配给好的匹配样本时，和相邻匹配样本一样，其基于十字交叉的代价聚合算法会表现得更好。

$N_{hi},N_{lo},P_{hi}$ 和图像块的大小 $n$ 是该方法的超参数。

3.2 神经网络结构

图2 我们的卷积神经网络的结构

我们使用图2所示的结构。这个网络由八层组成，从 $L 1$ 到 $L 8$ 。第一层是卷积层，而其他所有层都是全连接层。网络的输入是两个 $9 \times 9$ 的灰度图像块。第一层卷积层由32个 $5 \times 5 \times 1$ 大小的卷积核组成。 $L 2$ 层和 $L 3$ 层是各自拥有200个神经元的全连接层。在 $L 3$ 层后两个200维向量连接成400维向量，并通过从 $L 4$ 到 $L 7$ 四个各自拥有300个神经元的全连接层。最后一层， $L 8$ ，将输出投影到两个实数，然后作为SoftMax函数的输入，最后在好匹配和坏匹配两个分类上产生分布。左右图像块在网络 $L 1$ 、 $L 2$ 和 $L 3$ 层的权重是绑定的。除了 $L 8$ 层外，每层都有线性整流函数（Rectified Linear Unit, ReLU）。我们的网络结构没有使用池化层，包含了近60万个参数。该结构适合处理灰度图，但可以通过在 $L 1$ 层中学习 $5 \times 5 \times 3$ 而不是 $5 \times 5 \times 1$ 的滤波器来轻松处理RGB图像。网络的最佳超参数（例如层数、每层神经元数和输入的图像块的大小）将因数据集而异。我们选择这种结构是因为它在KITTI立体数据集上表现良好。

3.3 匹配代价

匹配代价 $C_{CNN}(\textbf{p},d)$ 直接由神经网络的输出计算得来：
$C_{CNN}(\textbf{p},d)=f_{neg}(<\mathcal{P}_{9×9}^{L}(\textbf{p}),\mathcal{P}_{9×9}^{R}(\textbf{pd})>)$
其中， $f_{neg}(<\mathcal{P}^{L},\mathcal{P}^{R}>)$ 是负类在网络输入图像块 $\mathcal{P}^{L},\mathcal{P}^{R}$ 上运行的输出。单纯来讲，我们必须考虑对图像的每个位置 $p$ 和每个视差 $d$ 执行正向传播。以下三个实现细节能使得运行可控：

每个位置 $p$ 只需要计算一次 $L 1$ 、 $L 2$ 和 $L 3$ 层的输出，不需要为每个视差 $d$ 重新计算。
通过向网络提供全分辨率图像进行传递而非 $9 \times 9$ 图像块，可以计算出一次正向传播中所有位置的 $L 3$ 层输出。为了实现这一点，我们将 $L 2$ 层和 $L 3$ 层卷积，在 $L 2$ 层中使用尺寸为 $5 \times 5 \times 32$ 的过滤器，在 $L 3$ 层中使用尺寸为 $1 \times 1 \times 200$ 的过滤器，两者都输出 $200$ 个特征映射。
同样，可以使用尺寸为 $1 \times 1$ 的卷积滤波器替换 $L 4$ 到 $L 8$ ，以计算单个正向传播中所有位置的输出。不幸的是，对于每个考虑的视差，我们仍然要进行正向传播。

4. 立体方法

为了有意义地评估匹配代价，我们需要把它与一种立体方法配对。我们所使用的立体方法受Mei等人的影响[11]。

4.1 基于交叉的代价聚合

通过平均固定窗口的匹配代价来融合邻近像素的信息。在接近深度不连续的情况下，由于违反了窗内深度不变的假设，这种方法会失败。我们更倾向于一种自适应地为每个像素选择领域的方法，这样支撑窗口只从视差相似的像素收集组成。在基于交叉的成本聚合[21]中，我们围绕每个位置构建一个局部邻域，其中包含具有相似图像强度值的像素。基于交叉的代价聚合首先需要在每个位置构建一个垂直交叉。只要满足以下两个条件，以位置 $\textbf{p}$ 为起点左臂 $\textbf{p}_{l}$ 可以一直延伸：

$|I(\textbf{p})-I(\textbf{p}_{l})|<\tau$ 位置 $\textbf{p}$ 和 $\textbf{p}_{l}$ 的图像强度值的绝对差值小于 $\tau$ 。
$||\textbf{p}-\textbf{p}_{l}||<\eta$ 位置 $\textbf{p}$ 和 $\textbf{p}_{l}$ 的物理水平距离（在上臂和下臂的情况下，是垂直距离）小于 $\eta$

右臂，下臂，上臂的构造也相似。一旦四臂已知，我们可以将支撑平面 $U(\textbf{p})$ 定义为所以放置在 $\textbf{p}$ 的垂直臂上的位置 $\textbf{q}$ 的水平臂的集合。

图3

Zhang等人[21]提议聚合需要考虑一个立体对的两幅图像的支撑平面。令 $U^{L}$ 和 $U^{R}$ 表示左图和右图的支撑平面。我们定义结合的支撑平面 $U_{d}$ 为
$U_{d}(\textbf{p})=\{\textbf{q}|\textbf{q}\in{U^{L}}(\textbf{p}),\textbf{qd}\in{U^{R}}(\textbf{pd})\}.\tag{7}$
匹配代价结合支撑平面取平均：
$C^{0}_{CBCA}(\textbf{p},d)=C_{CNN}(\textbf{p},d),\tag{8}$

$C^{i}_{CBCA}(\textbf{p},d)=\frac{1}{|U_{d}(\textbf{p})|}C^{i-1}_{CNN}(\textbf{p},d),\tag{9}$

其中 $i$ 是迭代次数。我们重复该平均过程四次；基于交叉的代价聚合的输出为 $C_{CBCA}^{4}$ 。

4.2 半全局匹配

我们通过对视差图添加平滑约束来优化匹配代价。根据Hirschmuller[4]，我们定义了一个取决于视差 $D$ 能量函数 $E (D)$ ：
$E(D)=\sum_{\textbf{p}}{\Bigg(C_{CBCA}^{4}(\textbf{p},D(\textbf{p})) \\+\sum_{\textbf{q}\in{N_{\textbf{p}}}}P_{1}×1\{|D(\textbf{p})-D(\textbf{q})|=1\}\\ +\sum_{\textbf{q}\in{N_{\textbf{p}}}}P_{2}×1\{|D(\textbf{p})-D(\textbf{q})|>1\}\Bigg)},\tag{10}$
其中 ${ . } 1\{.\}$ 表示指标函数。第一个式子用来惩罚具有高匹配代价的视差 $D(\textbf{p})$ 。第二个式子在相邻像素视差为1时添加一个惩罚 $P_{1}$ ，视差大于1时则如第三个式子添加一个更大的惩罚 $P_{2}$ 。比起在二维层面上最小化能量函数 $E (D)$ ，我们采用动态规划（Dynamic Programming，DP）进行单方向最小化。这种解决方案引入了不必要的条纹效应（streaking effects），因此在我们不打算优化的方向上不需要对视差图进行平滑约束。在半全局匹配中，我们将多个方向的能量 $E (D)$ 最小化，并且取平均获得最终结果。虽然Hirschmuller[4]建议选择16个方向，但我们只沿着两个水平方向和两个垂直方向进行优化；添加对角线方向并不能提高我们系统的精度。为了最小化 $\textbf{r}$ 方向的能量函数 $E (D)$ ，我们用如下的递推关系定义了一个匹配代价 $C_{\textbf{r}}(\textbf{p},d)$ ：
$C_{\textbf{r}}(\textbf{p},d)=C_{CBCA}^{4}(\textbf{p},d)-\min_{k}C_{r}(\textbf{p}-\textbf{r},k)\\ +\min\Bigg\{C_{r}(\textbf{p}-\textbf{r},d),C_{r}(\textbf{p}-\textbf{r},d-1)+P_{1},\\C_{r}(\textbf{p}-\textbf{r},d+1)+P_{1},\min_{k}C_{r}(\textbf{p}-\textbf{r},k)+P_{2}\Bigg\}. \tag{11}$
第二个式子避免 $C_{\textbf{r}}(\textbf{p},d)$ 过大，并且不影响最优视差图。根据图像梯度设置参数 $P_{1}$ 和 $P_{2}$ ，使视差中的跳跃部分和图像中的边缘是一致的。令 $D_{1}=|I^{L}(\textbf{p})-I^{L}(\textbf{p}-\textbf{r})|$ ， $D_{2}=|I^{R}(\textbf{pd})-I^{R}(\textbf{pd}-\textbf{r})|$ 。我们根据以下规则设定 $P 1$ 和 $P 2$ ：
$\begin{aligned} P_{1}=\Pi_{1}，\quad &P_{2}=\Pi_{2} &if\ D_{1}<\tau_{SO},D_{2}<\tau_{SO},\\ P_{1}=\Pi_{1}/4，&P_{2}=\Pi_{2}/4 &if\ D_{1}\geq \tau_{SO},D_{2}<\tau_{SO},\\ P_{1}=\Pi_{1}/4，&P_{2}=\Pi_{2}/4 &if\ D_{1}<\tau_{SO},D_{2}\geq\tau_{SO},\\ P_{1}=\Pi_{1}/10，&P_{2}=\Pi_{2}/10 &if\ D_{1}\leq\tau_{SO},D_{2}\geq\tau_{SO}; \end{aligned}$
其中 $\Pi_{1}$ ， $\Pi_{2}$ 和 $\tau_{SO}$ 是超参数。 $P_{1}$ 值在最小化垂直方向时减半。最终的代价 $C_{SGM}(\textbf{p},d)$ 通过取四个方向的平均值计算获得：
$C_{SGM}(\textbf{p},d)=\frac{1}{4}\sum_{\textbf{r}}C_{\textbf{r}}(\textbf{p},d).\tag{12}$
在半全局匹配后我们重复基于交叉的代价融合，如前一节所述。

4.3 计算视差图

视差图 $D$ 通过胜者为王策略（Winner-Take-All ，WTA ）计算，即通过找出视差 $d$ 来最小化 $C(\textbf{p},d)$ ，
$D(\textbf{p})=\arg\min_{d}C(\textbf{p},d).\tag{13}$

4.3.1 插值

让 $D^{L}$ 表示将左图作为参考图像得到的视差图——到目前为止我们也是这样做的，即让 $D^{L}(\textbf{p})=D(\textbf{p})$ 。然后按 $D^{R}$ 表示将右图作为参考图像得到的视差图。 $D^{L}$ 和 $D^{R}$ 在遮挡区域都有错误。我们通过使用左右一致性检查来检测到这些错误。我们将每个位置 $p$ 标记为以下任一：
$\begin{aligned} &correct \quad \quad \ \ if\ |d-D^{R}(\textbf{pd})|\leq1\ for\ d=D^{L}(\textbf{p}),\\ &mismatch \quad if\ |d-D^{R}(\textbf{pd})|\leq1\ for\ any\ other\ d,\\ &occlusion \quad \ otherwise. \end{aligned}$
对于标记为 $o c c l u s i o n$ （遮挡）的位置，我们想要从背景中获得新的视差值。我们通过向左移动直到我们找到一个标记为 $c o r r e c t$ （正确）的的位置并且使用该位置的视差值。对于标记为 $d i s m a t c h$ （未匹配）的位置，我们在十六个不同的方向上寻找最接近的正确像素，并使用他们视差的中位数进行插值。我们将插值视差图称作 $D_{INT}$ 。

4.3.2 亚像素增强

亚像素增强提供一种简单方法来提升立体算法的分辨率。我们通过相邻代价拟合二次曲线，得到一个新的视差图像：
$D_{SE}(\textbf{p})=d-\frac{C_{+}-C_{-}}{2(C_{+}-2C+C_{-})},\tag{14}$
其中 $d=D_{INT}(\textbf{p})$ ， $C_{-}=C_{SGM}(\textbf{p},d-1)$ ， $C=C_{SGM}(\textbf{p},d)$ ， $C_{+}=C_{SGM}(\textbf{p},d+1)$ 。

4.3.3 改良

有卷积的边界效应，视差图 $D_{SE}$ 比原始图像小。通过复制边界像素的视差来扩大视差图，从而匹配输入的大小。我们采用5×5中值滤波器和以下双边滤波器：
$D_{BF}(\textbf{p})=\frac{1}{W_{(\textbf{p})}}\sum_{\textbf{q}\in{\mathcal{N}_{\textbf{p}}}}D_{SE}(\textbf{q})\cdot \ g(||\textbf{p}-\textbf{q}||)\\ \cdot 1\{|I^{L}(\textbf{p})-I^{L}(\textbf{q})|<\tau_{BF}\},\tag{15}$
其中 $g (x)$ 是均值零，标准差为$\sigma $的正态分布的概率密度函数，$ W_{(\textbf{p})}$是归一化常数：
$W_{(\textbf{p})}=\sum_{\textbf{q}\in\mathcal{N}_{\textbf{q}}}g(||\textbf{p}-\textbf{q}||) \cdot 1\{|I^{L}(\textbf{p})-I^{L}(\textbf{q})|<\tau_{BF}\}.\tag{16}$
$\tau_{BF}$ 和 $\sigma$ 是超参数。 $D_{BF}$ 是我们立体方法的最终输出。

5. 实验结果

由于需要大规模训练集去学习神经网络中的权重，我们选择在KITTI立体数据集上评估我们的方法。

5.1 KTTI立体数据集

KITTI立体数据集[2]是一组灰度图像对，来自安装在车顶上的相距约54厘米的两个摄像头。这些图像是在白天，晴天和多云天气下，在Karlsruhe市及其周围行驶时拍摄的。数据集包括194个训练和195个测试的分辨率为1240×376的图像对。每个图像对都经过校正，使得一个物体出现在两个图像中的同一垂直位置上。一个旋转的激光扫描仪，安装在左摄像头的后面，提供地面真实深度。保留测试集的真实视差，并提供一个在线排行榜，以便研究人员在测试集上评估他们的方法。每三天只允许提交一次。KITTI立体数据集的目标是预测左图像上每个像素的视差。误差以实际视差和预测视差相差超过三个像素的像素百分比来衡量。将视差转换为深度，例如，距离相机2米的对象的误差公差为±3厘米，距离相机10米的对象的误差公差为±80厘米。

5.2 学习中的细节

利用随机梯度下降（stochastic gradient descent，SGD）训练网络，使交叉熵损失函数（cross-entropy loss）最小化。批处理大小设置为128。我们训练了16轮，学习率最初设置为0.01，并在12次和15次迭代中减少至十分之一。在进行学习之前，我们会打乱训练集。从194个训练图像对中，我们提取了4500万样本。一半属于正类，一半属于负类。我们对每幅图像进行预处理，减去平均值，再除以其像素强度值的标准差。立体方法在CUDA中实现，而神经网络的训练在Torch7环境中完成。立体方法的超参数如下：

5.3 结果

我们的立体方法在KITTI立体数据集上实现了 $2.61$ 的错误率，目前在线上排行榜排名第一。表1比较了该数据集上错误率表现得最好的几个算法。

表1 2014年11月KITTI立体数据集排行榜

我们选择了一组示例，以及我们方法的预测结果，展示在图5：

图5 左侧展示输入的左图，右侧展示我们立体算法的输出。从上到下，示例难度逐渐增加。较难的示例中有如反射面、遮挡物以及视差中跳跃区域等困难，例如栅栏和灌木丛。底部选用较难的示例来凸显我们方法中的缺陷，并说明在现实图像中立体匹配的固有困难。

5.4 运行时间

我们使用Nvidia Geforce GTX Titan GPU在计算机上测量实现的运行时间。训练需要5个小时。预测单个图像对需要100秒。从表2可以明显看出，预测过程中的大部分时间都花在卷积神经网络的正向传播上。

表2 预测包含的每个部分所需要的时间

5.5 训练集大小

我们想要知道是否更多的数据集可以使得立体方法表现更好。为了回答这个问题，我们在改变训练集大小的同时，在KITTI立体数据集的许多实例上训练我们的卷积神经网络。实验结果如图4所示。

图4 训练集上的误差和训练集中的立体对数量的函数

我们观察到训练集大小和测试集上的误差几乎呈线性关系。这些结果说明我们的方法会随着将来更大的数据集的出现而改进。

6. 结论

我们在KITTI立体数据集上的研究结果似乎表明，卷积神经网络是一种很好的计算立体匹配代价的方法。对于更大的数据集，错误率将会进一步降低。在立体方法中使用有监督的学习本身也是有益的。我们的方法还不适用于机器人导航等实时应用。未来的工作将会集中在提高网络的运行时性能上。

参考

[1] Collobert, R., Kavukcuoglu, K., and Farabet, C. (2011).Torch7: A matlab-like environment for machine learning. In BigLearn, NIPS Workshop, number EPFL-CONF-192376.

[2] Geiger, A., Lenz, P., Stiller, C., and Urtasun, R. (2013).Vision meets robotics: The KITTI dataset. International Journal of Robotics Research (IJRR).

[3] Haeusler, R., Nair, R., and Kondermann, D. (2013). Ensemble learning for confidence measures in stereo vision.In Computer Vision and Pattern Recognition (CVPR),2013 IEEE Conference on, pages 305–312. IEEE.

[4] Hirschmuller, H. (2008). Stereo processing by semiglobal matching and mutual information. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 30(2):328–341.

[5] Hirschmuller, H. and Scharstein, D. (2009). Evaluation of stereo matching costs on images with radiometric differences. Pattern Analysis and Machine Intelligence,IEEE Transactions on, 31(9):1582–1599.

[6] Kong, D. and Tao, H. (2004). A method for learning matching errors for stereo computation. In BMVC, pages 1–10.

[7] Kong, D. and Tao, H. (2006). Stereo matching via learning multiple experts behaviors.In BMVC, pages 97-106.

[8] Krizhevsky, A., Sutskever, I., and Hinton, G. (2012). Imagenet classification with deep convolutional neural networks. In Advances in Neural Information Processing Systems 25, pages 1106–1114.

[9] LeCun, Y., Bottou, L., Bengio, Y., and Haffner, P.(1998). Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86(11):2278–2324.

[10] Li, Y. and Huttenlocher, D. P. (2008). Learning for stereo vision using the structured support vector machine. In Computer Vision and Pattern Recognition,2008. CVPR 2008. IEEE Conference on, pages 1–8.IEEE.

[11] Mei, X., Sun, X., Zhou, M., Wang, H., Zhang, X., et al. (2011). On building an accurate stereo matching system on graphics hardware. In Computer Vision Workshops (ICCV Workshops), 2011 IEEE International Conference on, pages 467–474. IEEE.

[12] Peris, M., Maki, A., Martull, S., Ohkawa, Y., and Fukui, K. (2012). Towards a simulation driven stereo vision system. In Pattern Recognition (ICPR), 2012 21st International Conference on, pages 1038–1042. IEEE.

[13] Scharstein, D. and Pal, C. (2007). Learning conditional random fields for stereo. In Computer Vision and Pattern Recognition, 2007. CVPR’07. IEEE Conference on, pages 1–8. IEEE.

[14] Scharstein, D. and Szeliski, R. (2002). A taxonomy and evaluation of dense two-frame stereo correspondence algorithms. International journal of computer vision, 47(1-3):7–42.

[15] Spyropoulos, A., Komodakis, N., and Mordohai, P. (2014). Learning to detect ground control points for improving the accuracy of stereo matching. In Computer Vision and Pattern Recognition (CVPR), 2014 IEEE Conference on, pages 1621–1628. IEEE.

[16] Vogel, C., Roth, S., and Schindler, K. (2014). View-consistent 3d scene flow estimation over multiple frames. In Computer Vision–ECCV 2014, pages 263–278. Springer.

[17] Vogel, C., Schindler, K., and Roth, S. (2013). Piecewise rigid scene flow. In Computer Vision (ICCV), 2013 IEEE International Conference on, pages 1377–1384. IEEE.

[18] Yamaguchi, K., Hazan, T., McAllester, D., and Urtasun, R. (2012). Continuous markov random fields for robust stereo estimation. In Computer Vision–ECCV 2012, pages 45–58. Springer.

[19] Yamaguchi, K., McAllester, D., and Urtasun, R. (2013). Robust monocular epipolar flow estimation. In Computer Vision and Pattern Recognition (CVPR), 2013 IEEE Conference on, pages 1862–1869. IEEE.

[20] Yamaguchi, K., McAllester, D., and Urtasun, R. (2014). Efficient joint segmentation, occlusion labeling, stereo and flow estimation. In Computer Vision–ECCV 2014, pages 756–771. Springer.

[21] Zhang, K., Lu, J., and Lafruit, G. (2009). Cross-based local stereo matching using orthogonal integral images. Circuits and Systems for Video Technology, IEEE Transactions on, 19(7):1073–1079.

[22] Zhang, L. and Seitz, S. M. (2007). Estimating optimal parameters for mrf stereo from a single image pair. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 29(2):331–342.

数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
基于深度学习的目标检测算法综述：从RCNN到YOLOv13，一文看懂十年演进！人工智能教程深度学习目标检测算法人工智能自动驾驶 YOLO 机器学习
一、引言：目标检测的十年巨变2012年AlexNet拉开深度学习序幕，2014年RCNN横空出世，目标检测从此进入“深度时代”。十年间，算法从两阶段到单阶段，从Anchor-base到Anchor-free，从CNN到Transformer，从2D到3D，从监督学习到自监督学习，迭代速度之快令人目不暇接。本文将系统梳理基于深度学习的目标检测算法，带你全面了解技术演进、核心思想、代表算法、工业落地与
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版）
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版））工业相机使用YoloV8模型实现不同水果的检测识别工业相机通过YoloV8模型实现不同水果的检测识别的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入Yo
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
人工智能概念之九：深度学习概述
文章目录相关文章一、深度学习的定位：AI时代的基石技术1.1技术生态全景图1.2技术革命的催化剂二、深度学习的双面性：性能优势与技术挑战2.1技术优势全景扫描2.2技术挑战深度剖析三、技术演进时间轴：70年的厚积薄发四、主流框架生态对比五、未来演进方向相关文章人工智能概念之二：人工智能核心概念：网页链接一、深度学习的定位：AI时代的基石技术1.1技术生态全景图深度学习处于人工智能（AI）技术金字塔
学苑教育杂志《学苑教育》杂志社学苑教育编辑部2025年第21期目录 QQ296078736 人工智能
专题研究推进“教-学-评”一体化，打造小学语文高效课堂刘月兰;4-6教育管理新高考制度下普通高中生涯教育课程设计的研究霍亚贞;马玲;7-9课堂教学核心素养下小学数学深度学习课堂的构建策略康贵景;10-12“双减”背景下初中英语教学的课堂模式高燕;13-15小学低年级数学说理课堂构建策略玉洁;16-18基于法治观念培育的道法课项目式教学策略许静;19-21“双师课堂”在初中语文写作教学中的实践孙巧玲
使用 PyTorch 和 Pandas 进行 Kaggle 房价预测 Clang's Blog AI pytorch pandas 人工智能
文章目录1、环境设置2、数据下载3、数据预处理4、模型构建5、训练和验证6、训练模型并生成预测结果7、完整代码在本篇博文中，我们将探索如何使用PyTorch和Pandas库，构建一个用于Kaggle房价预测的模型。我们将详细讨论数据加载、预处理、模型构建、训练、验证及最终预测的全过程。1、环境设置我们首先需要导入所需的库，包括用于数据处理的pandas和numpy，以及用于深度学习的torch。i
使用中转API在Python中调用大型语言模型 (LLM) 的实践** qq_37836323 python 语言模型开发语言
**在人工智能技术中，大型语言模型(LLM)已成为自然语言处理(NLP)和生成任务的重要工具。然而，由于网络限制，直接访问OpenAI的API在中国可能面临挑战。因此，本文将介绍如何使用中转API地址http://api.wlai.vip来调用LLM，并提供相关的demo代码。什么是大型语言模型(LLM)？大型语言模型是一种深度学习模型，训练于大量文本数据上，能够生成、总结、翻译和回答问题等。Op
【免费下载】探索PlantVillage-Dataset：深度学习在植物病害检测中的革命性突破
探索PlantVillage-Dataset：深度学习在植物病害检测中的革命性突破在这个数字化时代，人工智能正逐步改变我们的生活，其中深度学习在农业领域的应用尤其引人注目。PlantVillage-Dataset是一个开放源代码的项目，它提供了一个庞大的植物病害识别数据集，旨在帮助开发人员和研究者利用机器学习技术改善农作物健康状况的监测。本文将深入探讨该项目的技术细节、应用价值及其独特之处。项目简
Python爬虫【五十八章】Python数据清洗与分析全攻略：从Pandas到深度学习的异常检测进阶程序员_CLUB Python入门到进阶 python 爬虫 pandas
目录背景与需求分析第一章：结构化数据清洗实战（Pandas核心技法）1.1数据去重策略矩阵1.2智能缺失值处理体系第二章：深度学习异常检测进阶2.1自动编码器异常检测（时序数据）2.2图神经网络异常检测（关系型数据）第三章：综合案例实战案例1：金融交易反欺诈系统案例2：工业传感器异常检测第四章：性能优化与工程实践4.1大数据处理加速技巧4.2模型部署方案第五章：方法论总结与展望5.1方法论框架5.
大模型【进阶】（一）MoE（mixture of experts）混合专家结构 ReinaXue 人工智能笔记语言模型神经网络
什么是MoE结构？MoE（MixtureofExperts，专家混合模型）是一种深度学习模型架构，通常用于处理大规模模型和计算资源效率的挑战。在MoE结构中，模型由多个“专家”组成，每个专家处理不同的任务或输入数据的不同部分，而不是让所有专家都参与每次计算。这种方式提高了计算效率，并在某些情况下有助于增强模型的表现。MoE结构的核心思想专家：在MoE模型中，专家通常指的是网络中的子模型，每个专家具
【三维目标检测】Complex-Yolov4详解（二）：模型结构 Coding的叶子 Python三维点云实战宝典 Complex-Yolo Complex-Yolov4 三维目标检测目标检测 python
本文为博主原创文章，未经博主允许不得转载。本文为专栏《python三维点云从基础到深度学习》系列文章，地址为“https://blog.csdn.net/suiyingy/article/details/124017716”。Complex-Yolo网络模型的核心思想是用鸟瞰图BEV替换Yolo网络输入的RGB图像。因此，在完成BEV处理之后，模型的训练和推理过程基本和Yolo完全一致。Yolov
基于深度学习的图像分类：使用ShuffleNet实现高效分类 Blossom.118 机器学习与人工智能深度学习分类人工智能机器学习数据挖掘 python 目标检测
前言图像分类是计算机视觉领域中的一个基础任务，其目标是将输入的图像分配到预定义的类别中。近年来，深度学习技术，尤其是卷积神经网络（CNN），在图像分类任务中取得了显著的进展。ShuffleNet是一种轻量级的深度学习架构，专为移动和嵌入式设备设计，能够在保持较高分类精度的同时，显著减少计算量和模型大小。本文将详细介绍如何使用ShuffleNet实现高效的图像分类，从理论基础到代码实现，带你一步步掌
AI人工智能领域深度学习的在线学习方法 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习学习方法 ai
AI人工智能领域深度学习的在线学习方法关键词：深度学习、在线学习、AI教育、实战项目、知识体系摘要：本文为想系统学习深度学习的初学者/转行者量身打造，通过拆解深度学习的核心概念、梳理在线学习的科学路径、提供可落地的实战案例与资源清单，帮你用“游戏通关”的思路高效掌握这门技术。无论你是学生、程序员还是跨行者，都能找到适合自己的学习节奏，避免“看视频就会，动手就废”的陷阱。背景介绍目的和范围深度学习是
AI人工智能深度学习的模型评估与选择 AI大模型应用之禅人工智能深度学习 ai
AI人工智能深度学习的模型评估与选择关键词：AI、人工智能、深度学习、模型评估、模型选择摘要：本文聚焦于AI人工智能深度学习中的模型评估与选择。在深度学习迅猛发展的当下，构建一个有效的模型并非易事，而准确评估和恰当选择模型对于模型性能的发挥和应用效果至关重要。文章将详细介绍模型评估与选择的相关背景知识，深入剖析核心概念与联系，阐述核心算法原理及具体操作步骤，运用数学模型和公式进行详细讲解并举例说明
深度学习中，定量分析和定性分析是什么？要体现什么？ seasonsyy 深度学习小知识深度学习人工智能定量分析定性分析
深度学习中，定量分析和定性分析是什么？要体现什么？在深度学习和一般的数据分析中，定量分析（QuantitativeAnalysis）和定性分析（QualitativeAnalysis）是两种主要的研究方法，它们分别关注数据的数量特征和质的特征。定量分析（QuantitativeAnalysis）定性分析（QualitativeAnalysis）关注方面定量分析涉及可量化的数据，即那些可以通过数字来
Python金融分析：情感分析在量化价值投资中的完整实现 AI量化价值投资入门到精通 python 金融开发语言 ai
Python金融分析：情感分析在量化价值投资中的完整实现关键词：Python金融分析、情感分析、量化投资、价值投资、自然语言处理、机器学习、金融文本挖掘摘要：本文系统解析如何将情感分析技术深度整合到量化价值投资体系中，通过Python实现从金融文本数据采集、预处理、情感建模到策略回测的完整流程。详细阐述基于规则引擎、机器学习和深度学习的多维度情感分析方法，结合财务指标构建复合投资模型，并通过实战案
开源深度学习新宠：Burn框架助您无忧高效建模
在日新月异的人工智能世界里，各类深度学习框架如雨后春笋般涌现，而Burn，作为新一代的深度学习框架，以其不妥协的灵活性、高效性和可移植性崭露头角。本文将深入探讨Burn的核心功能、应用场景及具体使用方法，帮助您更好地了解这款值得关注的开源项目。性能和优化：超越速度的追求Burn框架将高效性作为其核心支柱之一，通过一系列优化技术确保模型能够快速可靠地运行。以下是Burn在性能方面的几个显著特色：自动
使用 Dart 库轻松进行时间序列预测 - 立即执行多元预测 krishnaik06 深度学习 AI写作 python AI作画神经网络
这个视频介绍了名为Darts的Python库，它可以简化时间序列数据处理和预测。主要内容：解决时间序列预测难题：Darts库提供了多种模型，包括经典的ARIMA、SARIMAX，以及深度学习模型，可以轻松处理单变量和多变量时间序列预测。简化操作：Darts库使用统一的fit和predict函数，类似于scikit-learn，让用户可以轻松地使用各种模型。支持多种模型：Darts库包含ARIMA、
图像处理全栈指南：从传统算法到深度学习，再到FPGA移植阿牛的药铺图像算法区图像处理算法深度学习
图像处理全栈指南：从传统算法到深度学习，再到FPGA移植一、引言：图像处理是光学类产品的“大脑”光学类产品（可见光摄像头、红外热成像、光谱仪）的核心价值，在于将光信号转化为可理解的图像信息。而图像处理算法，就是解读这些信息的“大脑”——从传统的边缘检测到深度学习的目标识别，从实时降噪到高维光谱分割，每一步都决定了产品的性能（如分辨率、帧率、功耗）。对于算法移植工程师（科研助理1）岗位而言，需要掌握
基于Jetson Nano与PyTorch的无人机实时目标跟踪系统搭建指南
引言：边缘计算赋能智能监控在AIoT时代，将深度学习模型部署到嵌入式设备已成为行业刚需。本文将手把手指导读者在NVIDIAJetsonNano（4GB版本）开发板上，构建基于YOLOv5+SORT算法的实时目标跟踪系统，集成无人机控制与地面站监控界面，最终打造低功耗智能监控设备。通过本项目，读者将掌握：嵌入式端模型优化与部署技巧；多目标跟踪算法工程化实现；无人机-地面站协同控制架构；边缘计算场景下
gis怎么提取水系_深度学习在GIS中的应用 weixin_36214932 gis怎么提取水系
近年来，人工智能（AI）飞速发展，在诸如图像识别，图像分割和目标智能提取等任务上，达到甚至在某些方面超过了人工的准确度。人工智能在图像识别方面的优势，为AI和GIS的结合提供了前所未有的契机。人工智能，机器学习和深度学习正在帮助我们认识世界、改善世界。AI是计算机科学的一个重要分支，在某种程度上具有类似人类工作的执行能力，能以一种新的与人类相似的方式做出智能的反应，机器学习利用数据驱动算法从数据中
每天五分钟深度学习：数学中常见函数中的导数每天五分钟玩转人工智能每天五分钟玩转深度学习算法深度学习人工智能导数机器学习
本文重点导数是微积分学中的一个核心概念，它描述了函数在某一点附近的变化率。在物理学、工程学、经济学等众多领域中，导数都发挥着极其重要的作用。本文旨在详细介绍数学中常见函数的导数，以期为读者提供一个全面而深入的理解。数学中常见的导数常数函数的导数对于常数函数f(x)=C（C为常数），其导数为f'(x)=0。这是因为常数函数在任何点的切线斜率都是0，即函数值不随x的变化而变化。多项式函数的导数多项式函
无人机正摄影像自动识别与矢量提取系统 pk_xz123456 算法 python 无人机算法数据挖掘深度学习网络媒体
无人机正摄影像自动识别与矢量提取系统1.项目概述本项目旨在开发一个基于Python的自动化系统，能够从TIFF格式的无人机正摄影像中识别并提取多种地物要素，包括水边线、道路、桥梁、植被图斑、房屋、趸船和护岸。系统将采用深度学习与计算机视觉技术相结合的方法，实现高精度（95%以上）的自动识别，并将结果以带有相同坐标信息的矢量DWG/DXF格式保存。2.系统架构设计2.1总体架构系统采用模块化设计，主
玩转 Milvus（一）：解锁向量数据库的秘密，拥抱Milvus 不学无术の码农玩转 Milvus：向量搜索与 AI 实践 milvus 向量数据库
引言：向量数据库，AI时代的“超级引擎”想象一下，你上传一张猫咪照片，系统瞬间从百万张图片中挑出最相似的几张；或者在购物APP中点开一件T恤，推荐栏立刻展示你心动的搭配。这些智能体验的背后，藏着一个秘密武器——高维向量。通过深度学习模型，文本、图像、音频被转化为一串数字，捕捉它们的“灵魂”。但如何在海量向量中快速找到“最像”的那一个？传统数据库如MySQL或MongoDB束手无策，而向量数据库横空
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。