jjw_zyfx

Explaining Deepfake Detection by Analysing Image Matching 翻译

点击查看对应的代码

摘要

本文旨在解释深度伪造检测模型在仅由二进制标签做有监督时如何学习图像的伪迹特征。为此，从图像匹配的角度提出如下三个假设。1、深度伪造检测模型表明基于视觉概念的真/假图片既不与源图片相关也不与目标图片相关而是与伪迹图片相关。2、除了有监督的二进制标签，深度伪造检测模型通过训练集中的FST匹配（即匹配假、源、目标图像）隐式学习与伪迹相关的视觉概念。3、通过原始训练集中的FST匹配，隐式学习的伪迹视觉概念容易受到视频压缩的影响。在实验中，上述假设在各种DNN中得到了验证。进一步的，基于这种理解，我们提出了FST匹配深度伪造检测模型，以提高压缩视频的伪造检测性能。实验结果表明，我们的方法取得了很好的性能，尤其是在高度压缩（例如c40）视频上。

关键字：深度伪造检测图片匹配可解释性。

1、引言

       最近，深度伪造方法[14，27，25，44，43]在合成真实人脸方面表现出优异的性能。此类人脸伪造很容易被攻击者用于恶意目的，造成严重的社会问题和政治威胁。为此，大量研究[36，1]在检测各种操纵介质方面通过简单地将其视为二元分类任务，取得了巨大的成功。然而，仅使用有监督的二进制标签(真/假)理解这些模型如何学习图片的伪造特征对目前最好的算法来说仍然是一个挑战。

图 1. 源/目标相关的视觉概念和伪造相关的视觉概念之间的关系 在这里的视觉概念是图像区域，例如人类面部的眼睛、嘴巴和额头。在本文中，好的深度伪造检测训练模型从图像匹配的角度主要考虑和伪迹相关的视觉概念而不是源、目标相关的视觉概念。       在本文中，我们旨在从图像匹配的新视角来解释深度伪造检测模型的成功。我们考虑匹配图像如下。如图1所示，使用目标图像的表征来操纵源图像的面部，以生成相应的假图像。然后将上述伪图像、源图像和目标图像视为匹配图像，称为FST匹配。为此，我们设计了不同的度量来定量评估图像匹配的效果，并提出如下三个假设。
       假设1 深度伪造检测模型是指真/假图片是基于视觉概念的而不是基于源相关或者目标相关，也就是说，将此类视觉概念视为与伪迹相关。在本文中，视觉概念代表着人脸的嘴、鼻子或眼睛等图像区域。直观地说，假图是从视觉概念生成的它要么来自源图像要么来自目标图像。然而，一些视觉概念可能不可避免地被深度伪造方法操纵，导致它们与源图像和目标图像都不同。经过良好训练的深度伪造检测模型应该基于与源无关且与目标无关的视觉概念来表示真/假图像。
       假设2 除了有监督的二进制标签，深度伪造检测模型通过训练集中的FST匹配隐式地学习与伪迹相关的视觉概念。直观地说，二进制标签不足以完成deepfake检测任务。训练图像通常包含其他与伪迹无关的视觉概念，例如图像的身份。这种视觉概念可能共同出现在某些真/假的图像上，导致深度伪造检测模型学习有偏差的伪造表征。例如，如果真图像都是男性而假图像都是女性，则深度假检测模型可以基于图像的性别来推断结果。为此，FST匹配图像应该有助于深度伪迹检测模型丢弃与伪迹无关的视觉概念，并专注于与伪迹相关的视觉概念。因为它们共享与伪迹不相关的常见视觉概念，但使用相反的标签进行注解。
       假设3 通过原始训练集中的FST匹配，隐式的学习具有伪迹的视觉概念容易受到视频压缩的影响。深度伪造检测模型当在原始图片上进行训练，在压缩图像上进行测试时，通常会出现显著的性能下降[28，54，36]。我们认为这是因为通过FST匹配伪迹视觉概念的隐式学习对于视频压缩来说是脆弱的。特别是，由于压缩，隐式学习的伪迹视觉概念在假图像上可能变得无法把带压缩的源视觉概念和目标视觉概念区分开来，从而导致深度伪造检测模型做出错误预测。
       方法为了验证所提出的假设，我们提出了一种基于Shapley值[39]的解释方法，来解释具有各种骨干的深度伪造检测模型的预测。Shapley值首先在博弈论[39]中提出，并在最近的研究[31，2]中广泛用于解释DNN内部的表征。具体来说，Shapley值无偏见地估计了每个玩家对游戏总奖励的贡献。它自然满足四个属性，即线性属性、虚拟属性、对称属性和效率属性[45]，这确保了它的公平性和可信性。基于Shapley值，我们从图像匹配的新角度评估图像上的视觉概念，以验证所提出的假设。
       此外，在验证假设的过程中，我们惊奇地发现，在压缩图像中学习的源/目标视觉概念比在图像上隐式学习的伪迹视觉概念更一致。结合对假设1的理解，我们设计了一个简单的模型，通过从源/目标视觉概念中分离与源/目标无关的表征来指示图像（称为FST匹配深度伪造检测模型），旨在提高对压缩视频的伪造检测性能。我们的实验结果表明，如此简单的架构实现了很好的性能，尤其是在高度压缩（例如c40）的视频上。
       贡献： 我们的贡献可以总结如下。
       1.我们提出了一种从图像匹配的新角度解释深度伪造检测模型成功的方法，即FST匹配。
       2.从FST匹配的角度提出并验证了三个假设，这为深度伪造检测任务提供了新的见解。
       3.我们进一步提出了FST匹配Deepfake检测模型，以提高在压缩视频上的性能。

2、相关工作

2.1、深度伪造检测

深度伪造检测的目标是将输入媒介分类为真或假。以前对深度假检测的研究主要集中在提高模型在各种数据集上的性能。些方法[1，4，11，34，35，36]将其视为二分类任务，并在大量收集的数据集上直接训练模型，如Celeb DF[29]、DFDC[12]、FF++[36]等。这些方法在自己的数据集内评估取得了优异的性能，即在已知学习的深度伪造方法操作的图像上测试模型。然而，这些方法往往无法用新提出的深度伪造方法检测不可见操作的数据集。为此，其他研究[55，53，58，24]旨在提高深度伪造检测模型的泛化行。这些方法通常认为假图像共享通常的人类感知的伪迹表征并将此引入到深度伪造方法的处理中。例如混合边界[28]、几何特征[41]和频率特征[30,32,26,18]。然而，这样的假设通常代表着人类对伪迹表示的理解，可能不适用于所有现实生活场景。正确理解真实图像和伪图像之间的关键差异，即探索图像上伪迹表征的本质，仍然是一个持续性的挑战。
据我们所知，专注于解释深度伪造检测模型的可学习表征的研究是很少。在本文中，我们旨在从图像匹配的新角度来解释深度伪造检测模型，来论证对深度伪造检测模型来说什么是伪迹表征，他们是如何学习伪迹表征的，以及如何在现实场景中进一步提高其性能。

2.2、DNNs的可解释性

以往关于DNN可解释性的研究大致可分为两类。一些研究[47，33，13，40，46，57]通过可视化学习的视觉概念来关注DNN的语义解释。Grad CAM[38]和Grad CAM++[7]探索了基于梯度信息的输入图像的属性图。Zhou等人[56]可视化了DNNs内不同单元的实际感受野。Fong等人[15]探索了在多个过滤器和可学习的语义视觉概念之间的关系。Zhang等人提出通过图模型[51]和决策树[52]探索DNN的可学习语义视觉概念之间的关系。然而，与一般的分类任务不同，deepfake检测模型旨在图像上学习与伪影相关的视觉概念。这种表征通常是人们难以察觉的，这使得很难评估从上述方法得出的解释结果的正确性。此外，其他研究提出从数学上解释DNNs的表示，以避免人类对语义表征的估计。为此，一些研究建议基于熵的方法来理解DNN[19，9]。一些研究从博弈论的角度探索了DNN的表征[49，48，50]。然而，尽管上述方法在理论上可以应用于各种类型的DNN，但进一步利用解释结果来指导特定任务的学习（如深度伪造检测）仍然是一个挑战。
在本文中，我们的目标是从图像匹配的新角度弥补一般解释结果与学习的更好的深度伪造检测模型之间的差距。为此，我们根据我们的解释结果设计了FST匹配Deepfake检测模型，并进一步提高了在压缩视频上的性能。

3、算法

在本节中，给定一个训练好的深度伪造检测模型，我们旨在从图像匹配的新角度解释其预测。为此，提出了三个假设。为了验证这些假设，我们提出了在图像上基于Shapley值的评估视觉概念的贡献的一种解释方法[39]。有关Shapley值的更多信息，请参阅补充材料。

3.1、深度伪造检测模型的伪迹表征

       假设1 深度伪造检测模型是基于既不与源相关也不与目标相关的视觉概念的真/假图像，也就是说，这种视觉概念应认为与伪迹相关。
       在本节中，给定训练好的深度伪造检测模型vd（·）（本文中也称为检测编码器），我们旨在从图像匹配的角度从输入图像上评估已学习的视觉概念。具体而言，我们旨在探索在输入图像上的哪些视觉概念被视为与源相关、目标相关和伪迹相关。然后，我们期望评估这些视觉概念之间的关系，以验证假设。
       核心挑战是公平地决定哪些视觉概念与源、目标和伪迹表征相关。具体地说，我们不会在图像上手动标注这些视觉概念，因为它通常代表着人类对伪迹表征的理解，而不是模型中的伪迹表征。为此，我们训练源编码器vs（·）和目标编码器vt（·），以表示图像上的源/目标相关视觉概念。
       直观地说，每个假图像与其对应的源图像和目标图像共享某些共同的视觉概念。我们认为，当源编码器vs(这里的vs不是对手PK的vs而是个名字)将每个假图像及其对应的源图像分类为同一类别时，vs将倾向于关注每个假图像上的与源相关的视觉概念。对于目标编码器vt也是如此。具体来说，为了方便起见，我们使用图像的额外属性标签1来训练vs和vt。为了训练源/目标编码器vs/vt，每个假图像被视为拥有与相应的源/目标图像相同的属性标签。每个真图像都被视为其原始属性标签。
       我们使用Shapley值[39]来评估在图像上每个编码器预测的视觉概念的区域贡献。为了降低计算成本，我们将输入图像分成L×L个网格，并分别计算每个网格的贡献。设G＝ ${ g_{11}，g_{12}，…，g_{LL}\}$ 表示所有网格的集合。 $ϕ_{vd} ∈ R^{L×L}, ϕ_{vs} ∈ R^{L×L}, ϕ_{vt} ∈ R^{L×L}$ 分别表示检测编码器vd、源编码器vs和目标编码器vt的预测对所有网格的贡献。通过这种方式， $ϕ_{vd}、ϕ_{vs}和ϕ_{vt}$ 分别表示在图像上的伪迹、源和目标视觉概念。更具体地说， $g_{ij} ∈ G$ 如果 $ϕ_{vd} (g_{ij} |G) > 0$ 则认为与伪迹相关；如果 $ϕ_{vd} (g_{ij} |G) \le 0$ 则认为与伪迹无关。对于源编码器vs和目标编码器vt也是如此。
       基于网格级贡献，我们提出了一种度量标准，来评估与伪迹相关的视觉概念、与源相关的视觉概念和与目标相关的视觉概念之间的关系。根据该假设，深度伪造检测模型应该考虑与伪迹相关的视觉概念既不与源相关，也不与目标相关。因此，与伪迹相关的视觉概念应该与源/目标相关的视觉理念几乎没有交集。为此，我们首先生成掩码 $M_τ=I（max（φ_{vs}，φ_{vt}）>τ）$ ，以表示最重要的与源/目标相关的视觉概念，其中I（·）是指示函数，τ是某个阈值。如果内部条件有效，I（·）返回1，否则I（·）返回0。然后，该度量用于评估这些视觉概念之间的交叉强度，如下所示。 $Q_{\tau } = \frac {(1 - M_{\tau }) \cdot \phi _{v_d}}{\sum _{g_{ij}\in G}{[1-M_{\tau }(g_{ij})]}} - \frac {M_{\tau }\cdot \phi _{v_d}}{\sum _{g_{ij}\in G}{M_{\tau }(g_{ij})}} \quad\quad\quad\quad(1)$ 其中·表示内积。第一项测量与源/目标无关的视觉概念和伪迹相关视觉概念之间的交叉点的平均强度。第二项测量与源/目标相关的视觉概念和伪迹相关视觉概念之间的交叉点的平均强度。Qτ>0表示与伪迹相关的视觉概念与源/目标无关的视觉概念比与源/目的相关的视觉概念更相关。Qτ<0表示与伪迹相关的视觉概念与源/目标无关的视觉概念的相关性小于源/目标相关的视觉概念。

3.2、学习伪迹表征

假设2 除了有监督的二进制标签，深度伪造检测模型还通过训练集中的FST匹配隐式学习与伪迹相关的视觉概念。
在本节中，为了验证假设，我们期望评估训练集中的FST匹配如何影响深度伪造检测模型的学习。具体而言，训练集中的FST匹配意味着真图像包含与假图像的相应的源图像和目标图像。为此，我们分别使用成对的训练集和不成对的训练集训练两个模型。在成对的训练集中，真图像仅是假图像的对应源图像和目标图像。在不成对的图像中，真图像与成对训练集中的真图像的数量相同，但不对应于任何假图像，然后我们在两个模型上比较ACC、视频级AUC和所提的度量Qτ，以评估FST匹配的有效性。

3.3 在压缩视频上伪迹表征的脆弱性

假设3 通过原始训练集中的FST匹配隐式学习的伪迹视觉概念容易受到视频压缩的影响。
在本节中，为了验证假设，我们旨在测量隐式学习的伪迹视觉概念对压缩视频的稳定性。注意，检测编码器vd首先在原始图像上训练，然后在压缩图像上测试。为此，我们设计了稳定性度量，以评估在不同压缩率（即c23、c40）条件下伪迹视觉概念之间的变化。稳定性度量设计如下。 $\delta _{v_d} = E_{cmp\in \{c23,c40\}}[cos(\phi _{v_d}^{cmp}, \phi _{v_d}^{raw})] \quad\quad\quad\quad(2)$ 其中，表示当在压缩图像上测试时， $ϕ^{cmp}_{vd}$ 表示网格对检测编码器vd的预测的贡献。 $ϕ^{raw}_{vd}$ 表示在原始图像上测试的网格的贡献。cos（·，·）表示计算余弦相似度的操作。 $δ_{vd} ∈ [ 1, 1]$ 的值越小表明隐式学习的伪迹视觉概念越容易受到压缩的影响。此外，为了进行更多的比较我们还在压缩视频上评估了源/目标编码器 vs/vt的学习源/目标视觉概念的稳定性。

3.4 FST匹配深度伪造检测模型

       基于从FST匹配的角度对深度伪检测模型的理解。我们提出了FST匹配深度伪检测模式，以进一步提高深度伪检测在压缩视频上的性能。在验证假设3的过程中，我们意外地发现，通过源编码器vs和目标编码器vt（即 $ϕ_{vs}和 ϕ_{vt}$ ）学习的源/目标视觉感念与在压缩图片上通过检测编码器vd学习的伪迹视觉感念(如图2的底部)相比更一致。受假设1的理解的启发，我们认为直接从源/目标视觉概念中理清与源/目标无关的表征表明图像可能提高在压缩视频上的模型性能。详细验证请参见补充说明。

图 2. FST匹配深度伪造检测模型 如图底部所示，我们惊讶的发现，对压缩视频来说 $ϕ_{vs} 和 ϕ_{vt}$ 比 $ϕ_{vd}$ 更鲁棒。为此，我们使用源特征编码器和目标特征编码器来明确学习图像上的源和目标表征。特征分解模块进一步提取与源/目标无关的表征，以表示图像的真实性，即真或假。
       FST匹配深度伪造检测模型的结构如图2所示，该模型根据假设1旨在为在图像上的基于与源/目标不相关的视觉概念的脸部伪迹分类。为此，我们首先使用源特征编码器和目标特征编码器来直接学习图像上的源特征 $f_s ∈ R^{B×C_s}$ 和目标特征 $f_t ∈ R^{B×C_t}$ 。B表示输入图像的数量。 $C_s和C_t$ 表示输出通道的数量。然后，我们设计了特征分离模块来自动在通道上分割与源/目标不相关的 $f^{ir}_s ，f^{ir}_t$ 和与源/目标相关的 $f^r_s, f^r_t$ 。类似于[23]，我们使用智能的通道注意力向量 $a_s ∈ R^{B×C_s} 和 a_t ∈ R^{B×C_t}$ 来分离 $f_s和 f_t$ 其计算如下。 $a_s = \sigma (MLP(f_s)), \ a_t = \sigma (MLP(f_t)) \quad\quad\quad\quad(3)$ 其中，MLP表示多层感知机，σ表示sigmoid函数。通过这种方式，源和目标相关特征 $f^r_s, f^r_t$ 的计算公式分别为 $f^r_s = a_s ◦ f_s 和 f^r_t = a_t ◦ f_t$ 。源和目标不相关特征 $f^{ir}_s, f^{ir}_t$ 的计算公式分别为 $f^{ir}_s = (1-a_s) ◦ f_s 和 f^{ir}_t = (1-a_t) ◦ f_t$ 。这里◦表示智能通道的内积。
       为了确保分离特征的有效性，我们使用"伪源对验证模块"将 $f^r_s$ 和源图像的标签归为同一分布。同理通过"假-目标对验证模块"将 $f^r_t$ 和目标图像的标签归为同一分布。 $f^{ir}_s 和 f^{ir}_t$ 然后被拼接在一起来预测最终的输入图片标签的真/假。设 $y_s、y_t、y_d$ 表示图像的源属性标签、目标属性标签和伪造检测标签。 $\hat y_s, \hat y_t, \hat y_d$ 分别表示预测的源属性，目标属性和伪造预测。FST匹配的深度伪造检测模型的分类损失设计如下。 $Loss_{cls} = - E[y_d log \hat {y}_d] - \lambda _s E[y_s log \hat {y}_s] - \lambda _t E[y_t log \hat {y}_t ] \quad\quad\quad\quad(4)$
       而且，受 [49]的启发，为了最终的预测，我们设计了另一个损失函数来进一步的增强 $f^{ir}_s 和 f^{ir}_t$ 之间的相互作用。设h(·)为最终的预测模块。交互损失的目的是增加 $[f^{ir}_s , f^{ir}_t ] w.r.t$ 联合在一起时产生的额外奖励。并分别对 $f^{ir}_s 和 f^{ir}_t$ 对最终预测的奖励进行相加。交互损失的公式如下： $Loss_{interaction} = - E [h([f_s^{ir},f_t^{ir}]) - h([\mathbf {0},f_t^{ir}]) - h([f_s^{ir}, \mathbf {0}]) + h([\mathbf {0}, \mathbf {0}])] \quad\quad\quad\quad(5)$ 其中， $\mathbf 0$ 表示与 $f^{ir}_s 和 f^{ir}_t$ 大小相同的0向量 $h([\mathbf 0, \mathbf 0]$ 表示当 $f^{ir}_s 和 f^{ir}_t$ 都没对最终预测起作用时的基础得分。总的损失公式如下： $Loss_{cls} + \lambda _{inter} Loss_{interaction} \quad\quad\quad\quad(6)$

4、实验

4.1、实验细节

DNNs & 数据集: 为了验证所提出的假设，我们在不同的骨架上进行了各种实验。具体而言，我们使用ResNet-18/34[22]和EfficientNet-b3[42]作为检测编码器vd、vs和vt的骨干网络。此外，我们还使用[36]和[53]中发布的预训练模型用于检测编码器vd，以与目前最好的方法进行更多比较。
我们在广泛使用的FF++[36]数据集上训练并测试了我们的模型。F++[36]数据集包含5000个视频，包括1000个原始视频和4000个由不同伪造方法操纵的假视频，如Deepfake[14]、FaceSwap[25]、FaceShifter[27]、NeuralTextures[43]和Face2Face[44]。所有模型都在ImageNet[37]数据集上进行了预训练，并在FF++[36]上进行了微调。此外，为了方便，将输入图像的属性标签设置为图像的身份标识。具体地，对于假图像，源/目标编码器期望将图像分类为其对应的源/目标图像的身份标识。对于真实图像，源编码器和目标编码器都期望将图像分类为其自身的原始身份标识。
Shapley值的实现: Shapley值的精确计算在计算上是无法忍受的。为此，我们使用基于采样的方法[5]来近似计算所有视觉概念的贡献。在采样过程中，将未采样的图像网格设置为基线值，在本文中将其设置为零。此外，我们使用与图像的真值标签相对应的softmax层之前选定的标量作为所有编码器的输出分数。

4.2、Shapley值的公平性

图 3. Shapley值的不稳定性(左)，假设1的验证(右) 左图显示，随着采样时间的增加，Shapley值变得稳定。右图可视化了源、目标和伪迹的视觉概念的，即 $ϕ_{vs} , ϕ_{vt} 和 ϕ_{vd}$ 。结果显示，在各种操作算法中，与伪影相关的视觉概念与源/目标相关视觉概念几乎没有交集。这支持假设1。
Shapley值的精度: 为了确保近似Shapley值的稳定性，我们评估了采样次数T 随着Shapley值的变化所受的影响。具体而言，类似于[48]，我们对相同的采样次数T中重复了两次采样过程[5]，来分别获得 $ϕ 1 和 ϕ 2$ 。然后我们在所有测试集上通过不稳定度量 $\frac{||ϕ_1 -ϕ_2||_2}{||ϕ_1+ϕ_2||_2}$ 测量 $ϕ 1 和 ϕ 2$ 随着采样时间T的改变而改变。如图三所示。我们计算基于 ResNet18 $ϕ_{v_{d}}$ 的不同采样次数的不稳定性度量。结果表明当T ≥ 100时，我们得到了相对稳定的Shapley值，这确保了结果的公平性。

4.3、假设验证

假设1的验证： 假设1认为训练后表现好的深度伪检测模型是指基于既不与源相关也不与目标相关的视觉概念的图像，即认为它们与伪迹相关。在本节中，我们定性和定量地验证了假设。
       对于定性分析，我们发现与伪迹相关的视觉概念与源/目标相关的视觉理念几乎没有交集。在图3中，我们展示了在FF++[36]中使用的不同操作算法的主要贡献的视觉概念之间的相互作用，以及对 $ϕ_{vs} , ϕ_{vt} , ϕ_{vd}$ 的可视化结果。为了获得更好的可视化效果，我们将 $ϕ_{vs} , ϕ_{vt} , ϕ_{vd}$ 归一化为单位向量。检测解码器 $v_d$ 的骨干网络是ResNet-18[22]。源和目标相关的视觉概念基于掩码Mτ表示。为了更清楚，在交集列中，我们只保留了顶部最高的30%的贡献网格。结果表明，deepfake检测模型主要考虑伪迹相关概念，既不与源相关，也不与目标相关。

Table 1. 假设1的验证 对不同操纵算法中不同深度伪造检测模型所提出的度量Q $10^2)$ 的比较。结果表明，训练有素的深度伪检测模型具有更大的Q值，这表明这些模型将源/目标无关的视觉概念视为伪迹相关。
       为了进行定量分析，我们评估了各种DNN和操纵算法中提出的度量Q。在表1中，为了进行公平的比较，我们计算了不同阈值τ之间的Q的平均值。具体而言，τ被设置为不同的值，来保证 ${0.60L^2，0.65L^2，…，0.85L^2，0.9L^2，0.95L^2\}$ 网格分别在 $M_τ$ 上。Q>0表示所学习的伪迹相关视觉概念与源/目标无关视觉概念更相关，而不是与源/目的相关视觉概念更相关。结果表明，各种类型的DNN主要考虑与伪迹相关的视觉概念，既不与源相关，也不与目标相关。此外，这些结果与vs和vt的主干选择基本无关，这进一步验证了假设的普遍性。注意，当对FaceShifter[27]操纵的图像进行测试时，Xception[36]的Q<0。这是因为[36]中最初发布的预训练模型Xception之前从未在FaceShifter[27]操作过的伪造图像上进行过训练，因此无法定位FaceShifter[27]上的与伪迹相关的视觉概念。
假设2的验证： 假设2假设训练的好的深度伪检测模型通过训练集中的FST匹配隐式的学习了伪迹相关的视觉概念。为了验证这一假设，我们分别在成对的训练集和未成对的训练集上训练了两个具有相同骨架的模型。在成对的训练中，真图像只有源图像，假图像对应目标图像。相反，未不成对训练集中的真图像与假图像不匹配，但与配对训练集中真图像的数量相同。成对训练集和未成对训练集都是从仅包含40个图像身份特征的FF++[36]数据集向下采样的，与FF++[36]数据集中的初始1000个身份特征相比，这是非常小的。在本节中，我们进行了大量实验，以证明FST匹配对于学习深度伪造检测模型是至关重要。

Table 2. 假设2的验证 在整个FF++[36]数据集（表示为基线）、成对训练集和不成对训练集上训练的模型之间的性能比较。在成对训练集中，真实图像是伪图像的对应源图像和目标图像，即满足FST匹配。结果表明，在成对训练集上训练的模型实现了与基线相似的性能。注意，成对训练集的大小要小得多。这些结果证明了FST匹配的有效性。
       首先，我们比较了每个训练模型的ACC和视频级AUC。如表2所示，在成对训练集上训练的模型实现了与基线模型相似的性能，基线模型在整个FF++[36]数据集上训练。注意，成对训练集显著小于原始FF++[36]数据集，这证明了FST匹配在训练集中的重要性。相比之下，在未成对训练集上训练的模型，尽管与成对训练集大小相同，但显示出明显更差的结果。这些结果还表明，训练集中的FST匹配对于学习深度伪造检测模型来说具有重要价值。

图 4. 假设2的验证 所提出的度量Qτ在成对训练集和不成对训练集上训练的模型之间比较。水平坐标表示设置不同阈值τ时掩模Mτ中保持网格的百分比。检测编码器的骨干是ResNet-18[22]。结果表明，在成对训练集上训练的模型具有更大的Qτ值，这表明FST匹配有助于模型定位与伪迹相关的视觉概念。
        此外，我们还比较了每个训练模型之间提出的度量Qτ。为了进行公平的比较，我们计算了所有测试图像中不同τ的度量Qτ的值。如图4所示，在成对训练集上训练的模型具有更大的Qτ值，表明训练集中的FST匹配有效地帮助模型定位源/目标无关的视觉概念，并将其视为与伪迹相关。
假设3的验证： 假设3认为在原始训练集中通过FST匹配隐式学习伪影视觉概念容易受到视频压缩的影响。为了验证该假设，我们在压缩视频上测试了原始训练模型，并在所有测试图像中计算了所提出的度量 $δ_{v_{d}}$ 。对于定性分析，如图2所示，原始训练模型表明与原始图像相比，压缩图像具有明显不同的视觉概念。对于定量分析，在表11中，计算的 $δ_{v_{d}}$ ∈ [1，1]接近于0。这也表明在不同压缩率条件下， $ϕ_{v_{d}}$ 的变化很大。
        此外，我们还评估了源/目标视觉概念的稳定性。令人惊讶的是，如图2和表11所示，与隐式学习的伪迹视觉概念相比，这种学习的视觉概念在压缩视频上表现出了极大的一致性。这样的结果激励我们通过设计一个模型来提高压缩视频的模型性能，该模型明确地利用了训练集中的FST匹配。

4.4、FST匹配深度伪造检测模型

Table 4： 与目前最好的方法在视频压缩上的性能比较
在压缩视频上的性能比较： 在本节中，我们将我们的模型与当前最好的模型的性能进行了比较。表4显示了在压缩视频上的性能。我们的模型在在压缩视频上尤其是 c40视频上，达到了很好的性能。具体来说，当与其他方法的相同骨干相一致时，我们的模型在压缩视频上取得了优异的性能，尤其是在高度压缩的（例如c40）视频上。这些结果也表明了我们方法的广泛适用性。同时，请注意，在表4中的c23上，与MAT[53]仍存在微弱的性能差距。与我们的方法不同，MAT[53]设计了特定的模块来学习图像的频率特征。这些特征被广泛证明可以有效地增强深度伪造检测模型在压缩视频上的性能[18，26，30，32]。为此，我们认为将这些特性集成到我们的模型中可能会填补这一性能空白。此外，由于我们的方法只是利用我们的创新解释结果的第一次尝试，我们相信在未来在我们的研究基础上，可以进一步激发更有效的方法。

Table 5：在原始视频上的评估

在原始视频上的性能比较： 为了进行更全面的分析，我们还对原始视频模型进行了评估。表5中的结果表明，我们的方法在原始图像上仍然表现良好。

Table 6：在交叉数据集上的评估

泛化能力上的评估： 我们进行了另一个实验来评估我们方法的泛化能力。为此，我们和 SPSL [30]中采用了相同的交叉数据集实验设置。结果如表6所示，其中度量为AUC（%）。无论采用什么骨干[30]，我们在FF++[36]上训练的模型在Celeb DF[29]上取得了优异的性能。

Table 7：在交叉数据集上的评估 在 FF++上就图片编辑的 AUC (%)的鲁棒性。

图片编辑操作的鲁棒性： 当图像编辑操作应用于图像时，我们进行了另一个实验来评估我们的方法。为此，我们遵循了与LipForensics[21]中相同的鲁棒性实验设置。结果如表7所示，其中度量为AUC（%）。我们的方法对列出的扰动也表现出了很强的鲁棒性。

5、结论

在本文中，我们从图像匹配的新角度解释了深度伪检测模型的成功。为此，在各种DNN中，提出并验证了三种假设即：1.深度伪造检测模型基于既不与源相关也不与目标相关的视觉概念来表示真/假图像，而是将此类视觉概念视为与伪迹相关。2.除了有监督的二进制标签，deepfake检测模型通过训练集中的FST匹配隐式学习与伪影相关的视觉概念。3.通过原始训练集中的FST匹配隐式学习的伪影视觉概念容易受到视频压缩的影响。在此基础上，我们进一步提出了FST匹配深度伪造检测模型，并在压缩视频上取得了良好的性能。这项研究为探索图像伪迹表征的本质提供了机会，并为深度伪造检测任务提供了新的思路。

你可能感兴趣的:(学术论文,人工智能,深度学习)

为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）九章云极AladdinEdu 空间计算神经网络人工智能 gpu算力算法 java 开发语言
一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
企业级RAG的数据方案选择 - 向量数据库、图数据库和知识图谱南七小僧 AI技术产品经理网站开发人工智能数据库知识图谱人工智能
如何为企业RAG选择合适的数据存储方式摘要:本文讨论了矢量数据库、图数据库和知识图谱在解决信息检索挑战方面的重要性，特别是针对企业规模的检索增强生成（RAG）。看看海外人工智能企业Writer是如何利用知识图谱增强企业级RAG。要点概要：矢量数据库高效存储数据，但缺乏上下文和关联信息。图数据库优先考虑数据点之间的关系，受益于关系结构。知识图谱在语义存储方面表现出色，由于其能够编码丰富的上下文信息，
【人工智能入门必看的最全Python编程实战（1）】 DFCED 人工智能 python 开发语言深度学习找工作就业
--------------------------------------------------------------------------------------------------------------------1.AIGC未来发展前景未完持续…1.1人工智能相关科研重要性拥有一篇人工智能科研论文及专利软著竞赛是保研考研留学深造以及找工作的关键门票！！！拥有一篇人工智能科研论文
基于深度学习的目标检测算法综述：从RCNN到YOLOv13，一文看懂十年演进！人工智能教程深度学习目标检测算法人工智能自动驾驶 YOLO 机器学习
一、引言：目标检测的十年巨变2012年AlexNet拉开深度学习序幕，2014年RCNN横空出世，目标检测从此进入“深度时代”。十年间，算法从两阶段到单阶段，从Anchor-base到Anchor-free，从CNN到Transformer，从2D到3D，从监督学习到自监督学习，迭代速度之快令人目不暇接。本文将系统梳理基于深度学习的目标检测算法，带你全面了解技术演进、核心思想、代表算法、工业落地与
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版）
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版））工业相机使用YoloV8模型实现不同水果的检测识别工业相机通过YoloV8模型实现不同水果的检测识别的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入Yo
2025毫米波雷达技术白皮书：智能汽车与物联网的感知核心
随着人工智能、物联网（IoT）和智能汽车产业的迅猛发展，毫米波雷达技术正成为感知领域的核心驱动力。毫米波雷达凭借其高精度、全天候和强抗干扰能力，广泛应用于智能汽车的自动驾驶、物联网的环境感知以及工业自动化。2025年，毫米波雷达技术在性能、应用场景和市场规模上都达到了一个全新的高度。本白皮书将深入探讨毫米波雷达技术的核心优势、发展趋势及其在智能汽车与物联网中的应用前景，同时推荐各大品牌的领先产品方
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
人工智能概念之九：深度学习概述
文章目录相关文章一、深度学习的定位：AI时代的基石技术1.1技术生态全景图1.2技术革命的催化剂二、深度学习的双面性：性能优势与技术挑战2.1技术优势全景扫描2.2技术挑战深度剖析三、技术演进时间轴：70年的厚积薄发四、主流框架生态对比五、未来演进方向相关文章人工智能概念之二：人工智能核心概念：网页链接一、深度学习的定位：AI时代的基石技术1.1技术生态全景图深度学习处于人工智能（AI）技术金字塔
H800核心技术突破与行业应用实战智能计算研究中心其他
内容概要在人工智能技术持续迭代的背景下，H800芯片凭借自主架构优化与算力跃升，成为推动行业场景化落地的关键驱动力。本文将从技术路径、性能突破与行业应用三个维度，系统解析H800如何在高并发计算与低延时响应领域实现底层架构创新。首先聚焦其自主架构优化的核心技术路径，包括动态资源调度算法与异构计算单元的深度协同设计，揭示其在能效比与计算密度上的突破逻辑；进一步结合算力跃升的具体表现，探讨该芯片如何通
智慧建筑：科技引领房地产与建筑业的未来 RedPhoenix45
最新接入DeepSeek-V3模型，点击下载最新版本InsCodeAIIDE智慧建筑：科技引领房地产与建筑业的未来随着科技的飞速发展，人工智能（AI）和智能化工具正以前所未有的速度改变着各行各业。在房地产与建筑领域，这种变革尤为显著。从建筑设计到施工管理，再到物业管理，智能化技术正在重塑行业的每一个环节。本文将探讨如何利用先进的智能化工具提升房地产与建筑行业的效率，并介绍一款革命性的开发工具——它
学苑教育杂志《学苑教育》杂志社学苑教育编辑部2025年第21期目录 QQ296078736 人工智能
专题研究推进“教-学-评”一体化，打造小学语文高效课堂刘月兰;4-6教育管理新高考制度下普通高中生涯教育课程设计的研究霍亚贞;马玲;7-9课堂教学核心素养下小学数学深度学习课堂的构建策略康贵景;10-12“双减”背景下初中英语教学的课堂模式高燕;13-15小学低年级数学说理课堂构建策略玉洁;16-18基于法治观念培育的道法课项目式教学策略许静;19-21“双师课堂”在初中语文写作教学中的实践孙巧玲
智慧施工：AI技术赋能建筑安全监测新纪元
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！智慧施工：AI技术赋能建筑安全监测新纪元在现代建筑行业中，施工安全始终是核心关注点之一。随着科技的飞速发展，人工智能（AI）和大数据分析逐渐成为提升施工安全的重要工具。本文将探讨如何利用智能化软件和大模型API来构建高效的施工安全监测系统，并介绍一款强大的开发工具——InsCodeAIIDE的应用场景及其
智慧工地系统：建筑行业数字化变革的引领者青云智慧园区 java
在建筑行业积极迈向数字化转型的浪潮中，智慧工地系统凭借“数据驱动、智能管控、协同增效”的核心优势，深度融合物联网、大数据、人工智能等前沿技术，构建起覆盖工程项目全生命周期的精细化管理体系。以下将从系统架构、核心功能模块、应用价值以及未来展望等方面，全方位剖析智慧工地系统如何实现施工全过程的智能化、高效化管理。一、系统架构：打造一体化协同管理平台智慧工地系统采用先进的分层架构设计，以底层的数据采集层
AGI和AIGC傻傻分不清楚，一篇文章告诉你如何分辨！
Look！我们的大模型商业化落地产品更多AI资讯请关注Free三天集训营助教在线为您火热答疑‍什么是AGI(人工通用智能)?AGI是ArtificialGeneralIntelligence的缩写，中文翻译为“通用人工智能”，该术语指的是机器能够完成人类能够完成的任何智力任务的能力。与狭义的人工智能(ANI)不同，狭义的人工智能是为特定领域或问题而设计的，而AGI旨在实现一般的认知能力，能够适应任
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu