渺渺404

【跨模态行人重识别】RGB-Infrared Cross-Modality Person Re-Identification(ICCV2017)

文章目录

摘要
1 介绍
2 SYSU-MM01数据集
- 2.1 数据集描述
- 2.2 评估标准
3 跨模态模型的网络结构比较
- 3.1 常见的深度模型网络结构
- 3.2 网络结构分析
- - 单流结构和双流结构在特殊情况下的联系（双流网络可以用单流网络表示）
  - 一般情况下的单流结构分析
4 深度零填充
- 4.1 零填充作为网络输入的分析（梯度分析）
- 4.2 RGB-IR应用深度零填充
- 4.3 跨模态学习的比较
5 实验
- 5.1 比较的模型
- 5.2 模型比较与分析
6 总结

摘要

行人重识别（Re-ID）是视频监控中的一个重要问题，目的是在不同的摄像机视角下匹配行人图像。目前，大多数工作集中在基于RGB的重新识别上。然而，在某些应用中，RGB图像并不适合，例如在黑暗环境中或在夜间。红外线（IR）成像在许多视觉系统中变得很有必要。为此，需要将RGB图像与红外图像相匹配，这些图像是异质的，具有非常不同的视觉特征。对于人的重新识别来说，这是一个非常具有挑战性的跨模式问题，到目前为止还没有被研究过。在这项工作中，我们解决了RGB-IR跨模态重新识别问题，并提供了一个新的多模态重新识别数据集，名为SYSU-MM01，包括来自6个相机的491个身份的RGB和IR图像，总共有287,628张RGB图像和15,792张IR图像。为了探索RGB-IR Re-ID问题，我们评估了现有流行的跨域模型，包括三种常用的神经网络结构（单流、双流和不对称FC层），并分析了它们之间的关系。我们进一步提出了用于训练单流网络的深度零填充，以实现网络中跨模态匹配的特定领域节点的自动进化。我们的实验表明，RGB-IR跨模态匹配是非常具有挑战性的，但使用所提出的具有深度零填充的模型仍然是可行的，并给出了最佳性能。

1 介绍

行人重识别（Re-ID）是视频监控中的一个重要领域。大量针对Re-ID问题的模型已经被提出，包括特征学习[29, 48, 23]、距离度量学习[55, 15, 22, 28, 23, 24, 49, 57, 21, 44, 56]和端到端学习[20, 1, 47, 46]。大多数Re-ID方法都是基于RGB-RGB匹配，这是最常见的单模态Re-ID问题。
然而，当照明不足或无法使用时，RGB-RGB Re-ID在监控中可能会受到限制。例如，RGB图像在夜间变得毫无信息（图1）。在这种情况下，应该采用不依赖可见光的成像设备。红外线（IR）摄像机通常用于视频监控系统。虽然Kinect等RGB-D相机捕捉的深度图像也是独立于可见光的，但它们很少被部署，因为它们比较昂贵，只在室内使用，而且有距离限制。由于大多数监控摄像机能够在黑暗中自动从RGB模式切换到IR模式，因此有必要研究24小时监控系统中的RGB-IR跨模式匹配。

图1. 分别在白天和夜晚的两个室外场景中拍摄的RGB图像和红外（IR）图像的例子。每两列中的图像都是同一个人的。由接收不同波长的光的设备拍摄，同一个人的RGB图像和红外图像看起来非常不同。

在这项工作中，我们介绍了RGB-IR跨模态重识别问题。尽管RGB-IR Re-ID在现实世界的应用中很常见，也很重要，但据我们所知，它很少被探索，仍然是一个开放的问题。由于两种模式之间的巨大差异，RGB-IR再识别是一个非常具有挑战性的问题。首先，RGB和IR图像在本质上是不同的。见图1，第一行的RGB图像有三个通道，包含可见光的颜色信息，而第二行的IR图像有一个通道，包含不可见光的信息。因此，它们可以被看作是异质性数据。其次，从成像原理方面来看，RGB和IR图像的波长范围是不同的。在现有的Re-ID工作中，颜色信息是识别人员的最重要的外观线索。然而，在RGB-IR Re-ID问题上，这一线索很难被使用。如图1所示，即使是人类也很难通过颜色信息来识别人物。这导致了同一类别中严重的数据错位。此外，在基于RGB的Re-ID中引起巨大的类内差异的视角变化、姿势和曝光问题也给RGB-IR跨模态Re-ID带来困难，导致问题更具挑战性。虽然存在一些使用红外图像的Re-ID方法，如Jungling等人[13]。他们只考虑了IR-IR视频匹配的Re-ID，但没有考虑RGB-IR的跨模态Re-ID问题。
我们首先通过对流行的跨模态方法进行广泛的评估来确定RGB-IR Re-ID的挑战。为此，我们收集了一个新的数据集，称为SYSU多模态再识别（SYSUMM01）数据集。与现有常用的Re-ID数据集的比较见表1。它包含287,628张RGB图像和15,792张红外图像，这些图像由6台摄像机拍摄，涉及491人。就我们所知，这个新的RGB-IR Re-ID数据集首次为研究跨模式的RGB-IR Re-ID提供了一个有意义的基准。

对于跨模态匹配任务，由于领域的转变，特定领域的建模对于提取共享特征进行匹配是非常重要的。考虑到使用神经网络进行跨模态匹配，我们研究并分析了不同神经网络结构之间的关系，包括双流结构和非对称FC层结构，其中存在特定领域的建模，但需要手动设计。另外，我们提出了一种深度零填充方法，用于训练倾向于自动演化特定领域结构的单流网络。大量的实验表明了深度零填充的有效性，其性能优于手工制作的特征和深度模型的比较。
本文的贡献在于：
(1) 我们首次提供了一个标准的基准SYSU-MM01，用于支持RGB-IR跨模态Re-ID的研究。我们进行了广泛的实验，以评估流行的基线深度学习架构用于跨模态RGB-IR Re-ID。
(2) 我们分析了三种不同的网络结构（单流结构、双流结构和非对称FC层结构），并对它们在RGB-IR Re-ID中的有效性提出了见解。
(3) 我们提出了在为RGB-IR Re-ID任务优化的单流网络中自动演化特定领域结构的深度零填充法。我们的实验表明，这种用于RGB-IR跨模态Re-ID的方法不仅优于标准的单流网络，也优于具有明确跨域学习和额外计算成本的双流网络。

2 SYSU-MM01数据集

2.1 数据集描述

SYSU-MM01包含由6台摄像机拍摄的图像，包括2台红外摄像机和4台RGB摄像机。与RGB相机不同的是，红外相机是在黑暗环境下工作的。
我们在表2中显示了细节，并在图2中显示了每个摄像机视图的一些样本。摄像头1和摄像头2的RGB图像是由Kinect V1在两个明亮的室内房间（房间1和房间2）拍摄的。对于每个人来说，至少有400个不同姿势和视角的连续RGB帧。摄像机3和摄像机6的红外图像是由红外摄像机在黑暗中拍摄的。红外图像只有一个通道，它们与3通道的RGB图像不同。摄像机3被放置在黑暗环境中的2号房间，而摄像机6被放置在有背景杂物的室外通道。摄像机4和5是放置在两个室外场景中的RGB监控摄像机，名为大门和花园。

图2. SYSU-MM01数据集中的RGB图像和红外（IR）图像的例子。左边的相机1-3是室内场景，右边的相机4-6是室外场景。每两列都是同一个人。

观察数据集的样本，我们可以清楚地看到，红外相机（相机3和6）的图像在颜色和曝光方面都与RGB图像不同。具体来说，虽然相机2和3处于同一场景，但它们的图像遭受了戏剧性的颜色转变和曝光差异。例如，在RGB相机下，第一个人的黄色衣服和她的黑色裤子是截然不同的，但在红外相机下，这种颜色的区别几乎被消除了（图2中第1,2列，第2,3行）。
此外，红外图像只有一个通道，可能会失去一些纹理细节。在不同距离拍摄的红外图像的曝光也是一个问题。这些都给RGB-IR跨模式重新识别问题带来了困难。

2.2 评估标准

在SYSU-MM01数据集中有491个有效的ID。我们有一个固定的分割，使用296个身份进行训练，99个身份进行验证，96个身份进行测试。在训练阶段，训练集中296个身份在所有相机中的所有图像都可以被应用。
在测试阶段，来自RGB相机的样本用于gallery集，来自IR相机的样本用于probe集。
我们设计了两种模式，全搜索模式和室内搜索模式。在全搜索模式下，RGB相机1、2、4和5用于gallery集，红外相机3和6用于probe集。对于室内搜索模式，RGB相机1和2（不包括室外相机4和5）用于gallery集，红外相机3和6用于probe集。
对于这两种模式，我们采用单次拍摄（single-shot）和多次拍摄(multi-shot)的设置。对于RGB相机下的每一个身份，我们随机选择该身份的一/十张图像组成单张/多张设置的gallery集。对于probe集，所有的图像都被使用。给定一个probe图像，通过计算probe图像和gallery图像之间的相似性来进行匹配。请注意，匹配是在不同位置的相机之间进行的（位置如表2所示）。摄像机2和摄像机3在同一地点，所以摄像机3的probe图像跳过了摄像机2的gallery图像。计算完相似度后，我们可以根据相似度的降序得到一个排名表。
为了表示性能，我们使用累积匹配特性（CMC）[32]和平均精度（mAP）。请注意，对于多镜头设置下的CMC，只取同一人的所有gallery图像中的最大相似度来计算排名列表。我们用随机分割的gallery集和probe集重复上述评估10次，最后计算出平均性能。

3 跨模态模型的网络结构比较

我们对RGB-IR跨模态Re-ID的任务进行了研究。特别是，我们研究了三种常用于视觉识别和跨模态学习的网络结构。我们进一步利用深度零填充的理念进行模型训练，并深入了解其对跨模态匹配任务的影响。

3.1 常见的深度模型网络结构

在过去的几年里，大量的深度模型被提出用于视觉匹配和跨模态建模，并在许多任务中取得了令人满意的表现。最常用的结构主要可以分为3种类型。我们要讨论的所有结构都在图3中显示。
**单流结构。**单流结构是视觉任务中最常用的。如图3中的第一个网络所示，有单一的输入，所有的参数在整个网络中都是共享的。代表性的网络包括AlexNet[16]、VGG[38]、GoogleNet[40]、ResNet[9]等，它们在分类、检测、跟踪和许多其他任务中表现良好。在Re-ID领域，JSTL-DGD[47]，最先进的网络之一，也采用了单流结构。一般来说，在这些任务中，网络的输入是RGB图像，这些图像属于同一模式。因此，共享网络中的所有参数对于这些任务是合适的。
**双流结构。**双流结构通常用于跨模态匹配任务。如图3中的第二个网络所示，有两个输入，对应于两个不同领域的数据。在较浅的层中，网络的参数是针对每个领域的。在较深的层中，使用共享参数。Lin等人提出的用于包括Re-ID任务在内的跨域视觉匹配的广义相似性网络[26]是这种类型的代表结构之一。类似于双流结构的两个输入的网络在Re-ID任务中也是有利的，例如Ahmed的网[1]、SIR-CIR网[42]、门控连体网[41]等。请注意，除了Lin的结构[26]，它们中的大多数都喜欢在特定领域的层中共享参数。这与我们对双流结构的定义不完全相同。原因可能是，虽然图像来自不同的相机，但它们都是同一模式的RGB图像。与单流结构相比，双流结构实现了两点，即领域适应和鉴别性特征学习。我们假设特定领域的网络可以提取不同领域的共享特征，然后共享网络可以提取用于匹配的鉴别性特征。
**非对称FC层结构。**非对称FC层模型也被用于多域任务，例如MDNet[33]用于多域跟踪，CVDCA[2]用于Re-ID和IDR[10]用于VIS-NIR人脸识别等。如图3中第三个网络所示，除了最后一个FC层外，该结构几乎共享所有参数。这种设计假设不同领域的特征提取可以是相同的，而领域适应是在特征层实现的。这种特征提取和域适应的顺序与双流结构不同。

图3. 我们评估中的四种网络结构。卷积块的结构取决于基础网络（在我们的评估中是ResNet[9]）。conv块和FC层的颜色表示参数是否被共享。红色和蓝色表示特定参数，绿色表示共享参数。

3.2 网络结构分析

单流结构和双流结构在特殊情况下的联系（双流网络可以用单流网络表示）

上面讨论的三种结构似乎是不同的，我们发现有趣的是，当以下假设成立时，所有的结构在前向传播过程中都可以用单流结构表示。

假设1. 网络中的某处存在一个域选择子网络，它可以自动选择相应域的样本作为输入，并且该域选择子网络是固定的。

在假设1的前提下，我们首先给出一个简单的例子，说明单流网络如何在前向传播中表现为双流网络。如图4所示，左边是一个简化的双流网络：两个全连接网络，每个都有一个特定的层（蓝色和红色）和一个共享层（绿色）。右边是一个单流网络，在前向传播中可以有条件地等同于双流网络，其中有一个领域选择子网络用于选择下面的特定领域结构。我们首先定义一些符号来说明。让 $x_{d1}∈R_d$ 和 $x_{d2}∈R_d$ 分别表示域1和域2的输入。我们把域指标 $y_{ind}$ 定义为一个有两个元素的向量，其值为 $1, 0]^T$ 或 $0, 1]^T$ ，分别表示域1或域2。让 $f_{sel}(x, y_{ind})$ 表示域选择子网络，实现以下功能。

上式表明，如果领域选择子网络是固定的，那么在前向传播中，双流网络可以用单流网络表示。

图4. 解释单流网络如何代表假设1中的双流网络，在前向传播中带有域指标和域选择子网络。

一般情况下的单流结构分析

我们希望的上述假设是不太可行的。现在，我们放弃这个假设，分析单流网络的特定领域属性。对于跨模式的匹配任务，由于领域的转移，特定领域的建模对于提取共享成分进行匹配非常重要。一般来说，在神经网络中，例如双流和不对称FC层结构，这是由特定领域的结构来模拟的。因此，我们打算分析单流网络中的特定领域建模。我们的分析是基于以下宽松的假设。

假设2。如图5所示，对于处理两个领域输入的单流网络，我们将每层的输出节点分为三种类型，即领域1特定的节点、领域2特定的节点和共享节点。

这种分类取决于节点的响应是否是特定领域的。让 $x^{(l)}_{d1}$ 和 $x^{(l)}_{d2}$ 分别表示域1和域2的 $l + 1$ 层的输入。例如， $x^{(0)}_{d1}$ 和 $x^{(0)}_{d2}$ 是整个网络的输入。让 $η^{(l)}_{i}$ 表示第l层的第i个节点， $f_{out}(x^{(0)},i,l)$ 表示网络输入为 $x^{(0)}$ 时 $η^{(l)}_{i}$ 的输出，我们有：

其中 $σ (\cdot)$ 是激活函数， $w_{j,i}^{l-1}$ 和 $b_{i}^{l-1}$ 是第l - 1层的权重和偏置参数。节点 $η^{(l)}_{i}$ 的类型定义为

对于域1特定的节点，我们在 $f_{out}(x^{(0)}_{d2},i,l) ≡0$ （恒等于0）中使用身份符号，这意味着对于域2的任何输入，节点 $η^{(l)}_{i}$ 的输出总是零。
在假设2下，我们定义一些符号进行分析。让 $L$ 表示损失函数。让 $o^{l+1}_i$ 表示第 $i$ 个节点在第 $l + 1$ 层激活函数前的输出， $x (l)$ 表示第 $l + 1$ 层的输入， $w^{l}_i$ 和 $b^{l}_i$ 表示权重和偏置参数，即 $o^{(l+1)}_i=(w^(l)_i)^Tx^{(l)}+b^{(l)}_i$ 。使用上述定义的分类，在不丧失一般性的情况下， $x (l)$ 可以被分解为三个部分 $x^{(l)}=[x^{(l),1spe};x^{(l),2spe};x^{(l),s}]$ ，其中三个部分分别表示特定领域1、特定领域2和共享节点。我们也可以把 $w^{l}_i$ 表示为 $w^{(l)}_i=[w^{(l),1spe};w^{(l),2spe};w^{(l),s}]$ 。
对于领域1的网络输入 $x^{(0)}_{d1}$ ，根据分类定义， $x^{(l),2spe}=0$ ，因为对于每个领域2特定节点的输出， $f_{out}(x^{(0)}_{d1},i,l) ≡0$ 。在前向传播过程中，第l+1层的输出是

对于域2的网络输入 $x^{(0)}_{d2}$ ，类似的，我们有：

在反向传播过程中，对于域1的网络输入 $x^{(0)}_{d1}$

图5. 深度零填充方法的解释。在每一层中，蓝色节点表示领域1的特定节点，红色节点表示领域2的特定节点，绿色节点表示共享节点，虚线节点表示零值。

从上面的分析中，我们有两个结论：
(1)在前向传播中，如图5所示，权重参数 $w^{(l),1spe}$ （蓝色连接）和 $w^{(l),2spe}$ （红色连接）只对相应域的输入有影响，这与双流网络中的特定域参数相似。而对于 $w^{(l),s}$ （绿色连接），它对两个领域都有影响，这与双流网络中的共享参数类似。因此，网络可以通过特定领域的节点隐含地控制特定领域的结构，并通过共享节点控制共享的结构。
(2) 在反向传播中，如果一个节点是domain2-specific，输入在domain1，其对应的权重参数将不会被更新，因为梯度为零。这意味着其他领域的训练样本不会影响隐含的领域特定结构。请注意，对于输入 $x^{(0)}_{d2}$ ，可以用类似的方式得出同样的结论。
备注1. 如果假设网络中存在方程（3）所定义的三种类型的节点，那么一个单流网络可以隐含地学习和进化网络中的特定领域和共享结构。
备注2. 考虑到双流结构和不对称的FC层结构，它们是手工设计的，并在训练中固定下来。此外，两个领域的特定结构是解耦的，而共享结构是完全相同的。相反，如果单流结构可以隐式学习结构，那么对应于不同领域的隐式结构通过共享节点和共享偏置参数部分耦合（公式（4）和（5）），这可以为跨模态匹配任务的训练提供更大的灵活性。

4 深度零填充

4.1 零填充作为网络输入的分析（梯度分析）

由于我们在上一节中定义的节点类型（公式（3））是基于 $f_{out}(x^{(0)}_{d1},i,l) ≡0$ 和 $f_{out}(x^{(0)}_{d2},i,l) ≡0$ 的假设而非常优化的，如何使网络在训练阶段学习这种具有领域特性的节点仍然是一个重要问题。在大多数情况下，单流网络被应用于单域任务，它对所有的样本都是一视同仁的，所以一般来说，特定域的节点可能不会被学习。
正如前几节所分析的，双流网络和非对称FC层网络的结构是手工设计的，并在训练过程中固定下来，而单流网络可以通过学习特定领域的节点来隐含地演化网络结构，这可能会产生更多的最优结构。为此，我们建议使用零填充输入来刺激特定领域的反应。如图5所示，对于来自两个领域的输入 $x_{d1}∈R_d$ 和 $x_{d2}∈R_d$ ，我们应用零填充，如下所示

如果我们把网络输入视为前层（或称为第0层），那么根据我们在公式（3）中的定义，这样的前层中的所有节点肯定会被归类为特定领域节点。现在，下一层的节点是什么情况呢？事实上，我们很难从数学上说清楚，但我们发现，如果把零填充作为网络输入，网络中的节点更有可能成为特定领域的节点。这里我们继续第3.2节的分析，在对方程（4）和（5）应用激活函数σ(·)后，我们可以看到：

其中 $x^{(l+1)}_{d1,i}$ 和 $x^{(l+1)}_{d2,i}$ 表示第l+1层的第i个节点的输出，输入来自域1和域2。

我们发现，对于 $x^{(l+1)}_{d1,i}$ ，有一个独立的投影 $w^{(l),1spe})^{T}x_{d1}^{(l),1spe}$ ，它与 $x^{(l+1)}_{d2,i}$ 的激活函数内的部分没有重叠。这意味着 $w^{(l),1spe}_i$ 成为一个独立于 $x^{(l+1)}_{d2,i}$ 的激活函数中的条款的自由变量。因此，它可以为神经网络提供更多的灵活性，使 $f_{out}(x^{(0)}_{d1},i,l+1)>0$ 且 $f_{out}(x^{(0)}_{d2},i,l+1) ≡0$ ，以满足与方程(3)相比，对领域1特定节点的要求。
对于神经网络来说，将领域特定的节点分散到更深的层中会更容易。由于零填充不仅出现在输入中，而且还可以在网络中传播。我们称这种方法为深度零填充。
当然，我们的深度零填充只是让神经网络在网络中传播特定领域的节点时更加灵活，但并不强求。实际上，我们的神经网络学习在经验上支持这一点。如图7和图8所示，深度零填充帮助网络比没有零填充的网络更容易学习特定领域的节点。详细情况将在后面的第4.2节中说明。

4.2 RGB-IR应用深度零填充

在我们的RGB-IR跨模态行人重识别任务中，一个通道对应于卷积神经网络FC层的一个节点。对于图像来说，零填充是在通道层面进行的。如图6所示，RGB图像被转换为灰度图像并置于第一个通道中，然后将零填充图像置于第二个通道中。对于红外图像，它被放置在第二通道，零填充图像被放置在第一通道。

为了显示深度零填充的有效性，我们在实验中可视化了ResNet-6的特征图，并比较了深度零填充和原始单通道输入之间的差异。在图7中，我们计算了数据集上50个不同人的平均特征图，并显示了第一和第二卷积层的所有16个特征图。正如方程（3）中所定义的，我们可以对边界框所表示的特定领域的通道进行分类。很明显，与单通道输入相比，深度零填充有助于学习更多的特定领域通道。

图7. ResNet-6的第一和第二卷积层的特征图，带有深度零填充和单通道输入。在每一层中，第一行显示RGB输入的特征图，第二行显示IR输入的特征图。很明显，通过深度零填充学习的左边的特定领域通道要比通过单通道输入学习的多得多。

为了量化网络中的特定领域节点，我们计算每层中特定领域节点的比例。根据公式（3），设置了一个小的（严格的）阈值和一个大的（宽松的）阈值来确定节点是否是领域特定的。图8显示了特定领域节点的比例和层深度之间的关系。可以看出，特定领域的节点主要出现在较浅的层中。这是合理的，网络在第6层之后更倾向于共享结构。使用深层零填充有助于产生更多的领域特定节点，而没有零填充的比例在大多数层都很低。关于两个领域各自比例的细节在补充资料中提供。
特定领域的节点使网络能够使用不同的过滤器对来自不同领域的图像进行卷积，从而更好地缓解两个领域之间的差异（如图1中的梯度方向和曝光差异）。上述分析和表3中的实验结果表明，网络可以通过深度零填充更容易地学习特定领域的节点，并取得更好的性能。

图8. 特定领域节点的比例与层深度之间的关系。X轴表示网络中从下到上的层深度，Y轴表示特定领域节点的比例。严格的阈值是 $T=0.01std(x^{(l)}_i)$ ，宽松的阈值是 $T=0.05std(x^{(l)}_i)$ , $(x^{(l)}_i)$ 是第l层中第i个节点的输出的标准差）。一般来说，使用深度零填充的特定领域节点的比例要高于不使用零填充的节点。

4.3 跨模态学习的比较

虽然跨模态匹配任务在Re-ID问题上没有引起太多的关注，但在其他领域，如信息检索和人脸验证，已经有很多研究。跨模态检索（如文本-图像、标签-图像）在信息检索中发挥着重要作用。跨模态检索的模型可以分为实值表示和二元表示学习[43]。前者包括子空间学习方法[25, 30, 60]和深度学习框架[45, 6, 14, 12]，而后者包括线性模型[39, 36, 59, 51]和非线性模型[27, 50, 31]。Lin等人[26]提出的广义相似性测量是针对跨领域的视觉匹配任务，包括RGB-RGB Re-ID任务。视觉人脸与近红外人脸（VIS-NIR）的匹配[17, 58, 10]与RGB-IR跨模态重新识别相当相关。与VIS-NIR人脸识别相比，由于缺乏重要的颜色信息，RGB-IR Re-ID更具挑战性。剩下的有用线索可能是身体的形状，它在不同的视角和姿势下有很大的不同。
在一些多领域的学习方法中，例如HFA[18]，CRAFT[3]，在特征层面上应用了零填充，并被证明是有效的。这些工作与我们的深度零填充密切相关。相比之下，我们的零填充是在原始图像层面完成的，特定领域和共享学习是由深度神经网络完成的。

5 实验

我们在SYSU-MM01数据集上对现有的Re-ID和跨域匹配模型作为基线进行了广泛评估。然后，我们对深度模型的有效性进行了评估和分析，包括第3节中讨论的拟议的深度零填充和三种网络结构。详细的评估协议见第2.2节。

5.1 比较的模型

**Baseline。**我们评估了三个有利的手工制作的特征和跨领域的度量学习模型作为基线。手工制作的特征包括HOG[4]、LOMO[23]和HIPHOP[3]。度量学习方法包括KISSME[15]、LFDA[34]和跨域模型CCA[35]、CDFE[25]、GMA[37]、SCM[51]和CRAFT[3]。
**深度模型。**我们评估了图3所示的四种深度模型，包括单流网络、双流网络、不对称FC层网络和提出的深度零填充方法（网络结构与单流网络相同）。我们应用ResNet[9]中的残差块作为所有四个结构的基础卷积块。每个块的过滤器数量分别为16、16、64、128、256和512。下一层是256维的FC层，作为特征使用。对于这四个网络，损失函数是ResNet[9]中的softmax损失，它是常用的，而且相对稳定。所有的超参数都保持不变。对于前三个网络的输入，图像被转换为单通道灰度图像，并将其大小调整为224×224。对于我们提出的方法，输入被进一步处理，如第3节中所介绍的深度零填充。

5.2 模型比较与分析

深度模型与Baseline。
我们在表3中显示了比较结果，包括CMC[32]的rank-1、10、20准确率和平均精度（mAP）。
从表3中，我们可以清楚地看到，深度模型以较大的幅度超过了Baseline。具体来说，所提出的深度零填充模型在Rank-1的准确率方面超过了所有基线模型近10%。
所有的基线模型，即用跨领域的度量学习方法手工制作的特征，表现都很差：即使是最好的情况下的rank-1准确率也没有达到10%。请注意，LOMO特征包含丰富的颜色信息，它在RGB-RGB Re-ID问题上表现非常好。因此，结果表明，在RGB-IR匹配中，由于成像原理的不同，颜色的辨别力大大降低了。虽然身体形状和衣服的纹理可以用来识别人，但低级别的特征对于RGB-IR跨模态的人的再识别问题来说是没有足够的辨别力的。然而，对于深度模型来说，室内搜索的最佳等级-1准确性可以达到20.58%。虽然这个问题很有挑战性，但深度模型处理这个问题是可行的。

深度零填充与其他深度策略的比较。
尽管深层模型的表现总体上优于基线模型，但它们的表现在一定程度上存在差距。
在表3中我们可以看到，深度零填充的表现优于双流网络和非对称FC层结构。以单次设置下的全搜索模式下的rank-1准确性为例，深层零填充和双流/非对称FC层之间的差距为3.15%/5.50%。这可能是因为双流和非对称FC层的结构需要精心设计，所以它们的结构可能不是最佳的。
在相同的单流ResNet-6网络结构下，深度零填充也显示出比原始网络的优势。这些差异主要发生在训练阶段。深度零填充在输入层产生了两个特定领域的通道，帮助网络在训练阶段隐含地进化出特定领域的结构。由于特定领域和共享结构/组件是由网络自动学习的，单流网络的隐性结构可能比我们实验中手动设置的双流结构和不对称FC层结构更适合RGB-IR跨模态重新识别问题。
我们还评估了广义相似性度量（GSM），这是Lin等人提出的一个密切相关的跨域双流深度模型[26]。我们在实验中使用了作者发布的代码。Lin的网络并不像我们的双流模型那样有效。虽然它可以在RGB-RGB Re-ID方面取得良好的性能，正如[26]中所报告的那样，但在处理更具挑战性的RGB-IR跨模态Re-ID问题时，它就逊色了。

深度零填充与域指标[0,1]向量的关系。
如第3节所述，单流网络可以作为双流网络工作，因为存在域指标。
因此，我们在输入图像中添加了两个额外的通道作为域指标。对于RGB图像，第一个通道的所有像素都被填充为255，第二个通道为0，而对于红外图像，第一个通道被填充为0，第二个被填充为255。这种填充程序明确地给网络提供了领域指标。
性能比较见表4。
表4显示，我们提出的深度零填充方法取得了最佳性能。带有域指标的输入只取得了与原始单流网络相当的性能。这一结果表明，深度零填充可以更有效地利用域信息。

6 总结

据我们所知，这项工作是第一个确定RGB-IR跨模态Re-ID问题的工作，并引入了一个新的多模态Re-ID数据集，名为SYSU-MM01。
RGB和IR图像之间的巨大差异使得RGB-IR跨模态重新识别成为一个非常具有挑战性的问题。我们讨论并评估了跨领域任务的三种常见网络结构，包括单流结构、双流结构和不对称FC层结构。我们分析了单流和双流结构之间的联系，发现如果存在特定领域的共享节点，单流网络可以隐性地学习和进化特定领域的结构。我们提出了深度零填充的方法来帮助一流网络更有可能自动演化出特定领域的节点，从而使隐含的网络结构更适合于任务，与人工设计的两流网络的固定结构相比，这是一种替代的、灵活的跨模式建模方式。实验表明，通过深度零填充训练的单流网络取得了最佳性能。

你可能感兴趣的:(跨模态行人重识别,计算机视觉,人工智能,深度学习)

为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元 Liudef06小白特殊专栏 AIGC 人工智能 AI作画人工智能 AIGC
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元随着多模态AI技术的爆发式发展，StableDiffusionXL（SDXL）等文生图模型正在彻底重塑创意产业工作流。本文将深入解析如何在魔搭平台高效训练SDXL模型，并探讨AI绘画技术对设计行业的革命性影响。一、SDXL模型架构解析1.1双文本编码器设计SDXL采用双文本编码器架构，显著提升提示词理解能力：#SDXL文本编码器结构示意c
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）九章云极AladdinEdu 空间计算神经网络人工智能 gpu算力算法 java 开发语言
一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
Spring Security OAuth2.0在分布式系统中的安全实践
引言分布式系统架构下，安全认证与授权面临跨服务、高并发、多租户等挑战。SpringSecurity与OAuth2.0的结合为微服务安全提供了标准化解决方案。分布式系统中的安全挑战跨服务身份认证的复杂性令牌管理的可扩展性问题多租户场景下的权限隔离需求防止CSRF、XSS等常见攻击SpringSecurityOAuth2.0核心架构授权服务器设计@EnableAuthorizationServer配置
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
高铁站违规撑伞识别误检率↓79%：陌讯多模态融合算法实战解析 2501_92722744 算法人工智能目标检测计算机视觉目标跟踪
原创声明本文为原创技术解析，核心技术参数与架构参考自《陌讯技术白皮书》，禁止未经授权的转载与改编。一、行业痛点：密集场景下的违规撑伞识别难题在高铁站、地铁站等交通枢纽，违规撑伞（如非雨天在站台、通道内持伞）可能引发客流拥堵、设备刮擦等安全隐患。然而，传统视觉识别方案面临三大核心挑战：环境干扰大：进出站口光线突变（正午强光/夜间弱光）导致伞面特征提取不稳定，某枢纽站点实测数据显示，阴雨天违规撑伞识别
建筑施工场景下漏检率↓76%！陌讯多模态融合算法在工程安全监控的落地实践 2501_92722744 大数据算法目标跟踪人工智能计算机视觉目标检测
原创声明本文为原创技术解析，核心技术参数与架构设计引用自《陌讯技术白皮书》，转载请注明来源。一、行业痛点：建筑施工监控的技术瓶颈建筑施工场景的安全监控长期面临多重技术挑战：数据支撑：据《2023建筑施工安全自动化监控报告》显示，传统监控系统对“未佩戴安全帽”“高空抛物”等危险行为的漏检率超35%，误报率高达42%，导致安全事故响应滞后[7]。场景难点：工地存在强光直射（正午阳光）、动态遮挡（塔吊/
构建跨平台远程医疗系统中的视频通路技术方案探究音视频牛哥 RTMP播放器 RTSP播放器大牛直播SDK 音视频远程医疗国产系统rtmp 国产系统rtsp 信创rtsp播放器信创rtmp播放器大牛直播SDK
一、远程医疗走向日常化，音视频能力成为关键基础设施随着医疗数字化与分级诊疗体系的不断演进，远程医疗正从试点探索阶段，逐步迈向常态化、标准化应用。从县域医院远程问诊、基层医疗协作，到大型三甲医院的术中协同、专科教学直播，再到跨机构的医疗资源共享和辅助诊断，音视频能力已成为整个远程医疗系统中的核心支撑与底层基座。然而，医疗行业对音视频系统的要求远远高于普通办公或娱乐场景。实时性不仅关乎沟通效率，更直接
企业级RAG的数据方案选择 - 向量数据库、图数据库和知识图谱南七小僧 AI技术产品经理网站开发人工智能数据库知识图谱人工智能
如何为企业RAG选择合适的数据存储方式摘要:本文讨论了矢量数据库、图数据库和知识图谱在解决信息检索挑战方面的重要性，特别是针对企业规模的检索增强生成（RAG）。看看海外人工智能企业Writer是如何利用知识图谱增强企业级RAG。要点概要：矢量数据库高效存储数据，但缺乏上下文和关联信息。图数据库优先考虑数据点之间的关系，受益于关系结构。知识图谱在语义存储方面表现出色，由于其能够编码丰富的上下文信息，
【人工智能入门必看的最全Python编程实战（1）】 DFCED 人工智能 python 开发语言深度学习找工作就业
--------------------------------------------------------------------------------------------------------------------1.AIGC未来发展前景未完持续…1.1人工智能相关科研重要性拥有一篇人工智能科研论文及专利软著竞赛是保研考研留学深造以及找工作的关键门票！！！拥有一篇人工智能科研论文
基于深度学习的目标检测算法综述：从RCNN到YOLOv13，一文看懂十年演进！人工智能教程深度学习目标检测算法人工智能自动驾驶 YOLO 机器学习
一、引言：目标检测的十年巨变2012年AlexNet拉开深度学习序幕，2014年RCNN横空出世，目标检测从此进入“深度时代”。十年间，算法从两阶段到单阶段，从Anchor-base到Anchor-free，从CNN到Transformer，从2D到3D，从监督学习到自监督学习，迭代速度之快令人目不暇接。本文将系统梳理基于深度学习的目标检测算法，带你全面了解技术演进、核心思想、代表算法、工业落地与
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版）
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版））工业相机使用YoloV8模型实现不同水果的检测识别工业相机通过YoloV8模型实现不同水果的检测识别的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入Yo
Mybatisplus的雪花算法及代码生成器的使用你我约定有三算法 dreamweaver
1.雪花算法1.1背景:雪花算法（Snowflake）的使用背景主要源于高并发分布式系统环境下对唯一ID生成的需求。这种需求在像Twitter这样的社交媒体平台上尤为突出，因为Twitter需要处理每秒上万条消息的请求，并且每条消息都必须分配一个唯一的ID。这些ID不仅需要全局唯一，以跨机器、跨时间区分，还需要保持一定的顺序性（尽管不要求连续），以方便客户端排序和后续的数据处理。1.2与自动递增的
2025毫米波雷达技术白皮书：智能汽车与物联网的感知核心
随着人工智能、物联网（IoT）和智能汽车产业的迅猛发展，毫米波雷达技术正成为感知领域的核心驱动力。毫米波雷达凭借其高精度、全天候和强抗干扰能力，广泛应用于智能汽车的自动驾驶、物联网的环境感知以及工业自动化。2025年，毫米波雷达技术在性能、应用场景和市场规模上都达到了一个全新的高度。本白皮书将深入探讨毫米波雷达技术的核心优势、发展趋势及其在智能汽车与物联网中的应用前景，同时推荐各大品牌的领先产品方
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
人工智能概念之九：深度学习概述
文章目录相关文章一、深度学习的定位：AI时代的基石技术1.1技术生态全景图1.2技术革命的催化剂二、深度学习的双面性：性能优势与技术挑战2.1技术优势全景扫描2.2技术挑战深度剖析三、技术演进时间轴：70年的厚积薄发四、主流框架生态对比五、未来演进方向相关文章人工智能概念之二：人工智能核心概念：网页链接一、深度学习的定位：AI时代的基石技术1.1技术生态全景图深度学习处于人工智能（AI）技术金字塔
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl