旋转的油纸伞

【论文精读WACV_2023】FaceOff: A Video-to-Video Face Swapping System

一、前言
Abstract
1. Introduction
2. Related Work
3. FaceOff: Face Swapping in videos
- 3.1. Merging Videos using Quantized Latents
- 3.2. Self-supervised Training Approach
- 3.3. Reproducing Inference Errors at Training
4. Experiments and Results
- 4.1. Face-Swapping Results
- 4.2. Target Face Manipulation Results
5. Ablation Study
6. Conclusion

一、前言

Aditya Agarwal, Bipasha Sen, Rudrabha Mukhopadhyay, Vinay Namboodiri, C.V. Jawahar

【Paper】 > 【Code】 > 【Project】
论文贡献：
(1)引入了V2V面部交换，这是一种新颖的面部交换任务，旨在交换源面部身份和表情，同时保留目标背景和姿势。
(2) 提出 FaceOff：一种以自我监督方式训练的 V2V 换脸系统。 FaceOff 通过合并两个不同的面部视频来生成连贯的视频。
(3) 该方法在推理时直接作用于没见过的身份，无需任何微调。
(4) 该方法不需要任何推理时间优化，推理时间不到一秒。
(5)发布了V2VFaceSwap测试数据集，并为V2V换脸任务建立了基准。

创新点是旧方法新任务

Abstract

背景介绍：双打在电影界扮演着不可或缺的角色。他们在危险的特技场景或同一演员扮演多个角色的场景中代替演员。随后，利用昂贵的 CGI 技术，将替身的脸部和表情手动替换为演员的脸部和表情，耗资数百万美元，耗时数月才能完成。一种自动化、廉价且快速的方法可以是使用面部交换技术，该技术旨在将身份从源面部视频（或图像）交换到目标面部视频。然而，此类方法无法保留对场景上下文很重要的演员的源表情。
工作介绍：为了应对这一挑战，我们引入了视频到视频（V2V）面部交换，这是一种新颖的面部交换任务，可以保留（1）源（演员）面部视频的身份和表情以及（2）背景以及目标（双）视频的姿势。
我们提出了 FaceOff，这是一种 V2V 面部交换系统，它通过学习鲁棒的混合操作来按照上述约束合并两个面部视频。它将视频减少到量化的潜在空间，然后将它们混合在减少的空间中。 FaceOff 以自我监督的方式进行训练，能够稳健地解决 V2V 换脸的重大挑战。
实验：如实验部分所示，FaceOff 在质量和数量上都显着优于其他方法。

1. Introduction

有双打对于电影中的主演来说是电影制作中不可缺少的组成部分。
在涉及困难和危险的危及生命的特技场景中，替身可能会代替演员的位置。他们甚至可以在常规填充场景或多次重拍中代替演员。
例如，《社交网络》广泛使用替身作为演员 Armie Hammer 的替身，后者扮演了双胞胎兄弟的多个角色。
在这样的场景中，替身的脸随后被演员的脸和表情所取代，并使用 CGI 技术，需要在繁重的图形单元上进行数百小时的手动多媒体编辑，耗资数百万美元，并需要数月才能完成。
因此，制作团队通常被迫通过改变场景的机制来避免此类场景，使得仅捕捉替身的身体以提供演员的幻觉。这可能会限制导演的创造力。然而，这种调整并不总是可行的。

另一种情况是后期制作场景修改。如果在后期制作中发现对话比原始场景更适合场景，则整个场景将被重置并重新拍摄。
我们建议演员可以在录音室录音，并将他们的脸叠加在之前的录音上。
事实上，和其他行业一样，电影行业也正朝着演员可以在家工作的方向发展。在当今时代，CGI 技术可以产生令人难以置信的人体结构、场景和逼真的图形。然而，众所周知，他们很难创造出逼真的皮肤。
如图1所示，演员可以在舒适的家中或工作室中展现自己的身份和表情，而将繁重的任务留给图形或替身。
此类任务所需的 CGI 技术需要手动操作、昂贵且耗时。

为了自动化此类任务，基于快速且廉价的计算机视觉的面部交换 \cite{deepfacelabs，motion-coseg，fsgan，faceswapdisney，faceshifter，faceswapphotos}技术，旨在在源（演员）视频和目标（双）视频可以考虑。然而，此类技术不能直接使用。换脸仅交换源身份，同时保留目标视频的其余特征。在这种情况下，演员的表情（源）不会在输出中捕获。
为了解决这个问题，我们引入了“视频到视频（V2V）面部交换”作为面部交换的新颖任务，其目的是 $\textbf{(1)}$ 交换源面部视频的身份和表情和 $\textbf{(2)}$ 保留目标人脸视频的姿势和背景。
目标姿势至关重要，因为它取决于场景的上下文。
例如，特技演员在室外表演，与机器打交道或与替身演员交谈；演员在演播室的绿幕前表演。在这里，替身的姿势是情境感知的，而演员只是即兴发挥。

$\textbf{所提出的任务如何是视频到视频换脸任务？ }$ 与将固定身份组件从一个视频交换到另一个视频的换脸任务不同，V2V 换脸任务将随时间变化的表情（一个视频）与另一个具有变化姿势和背景的视频（另一个视频）交换，从而使我们的任务视频-到视频。

$\textbf{方法：}$ 在视频中交换脸部并非易事，因为它涉及合并两种不同的运动 - 演员的脸部运动（例如眼睛、脸颊或嘴唇运动）和替身的头部运动（例如姿势和下巴运动）。这需要一个可以将两个不同的运动作为输入并产生第三个相干运动的网络。
我们提出 $\textbf{FaceOff}$ ，一种视频到视频的面部交换系统，它将面部视频减少到量化的潜在空间并将它们混合在减少的空间中。
训练这样一个网络的一个基本挑战是缺乏基本事实。
面部交换方法 \cite{motion-coseg, fsgan, deepfacelabs} 使用鉴别器-生成器设置来训练网络。
鉴别器负责监视交换输出的所需特性。然而，使用鉴别器会导致输出与输入不同的幻觉成分 - 例如，修改的身份或新的表情。
因此，我们设计了一种自我监督的训练策略来训练我们的网络：我们使用单个视频作为源和目标。然后我们在源视频上引入伪运动误差。最后，我们训练一个网络来“修复”这些伪错误以重新生成源视频。

FaceOff 可以在推理时直接对看不见的交叉身份进行换脸，无需任何微调。
此外，与大多数在高端 GPU 上需要优化推理时间从 5 分钟到 24 小时不等的换脸方法不同，FaceOff 只需一次前向传递即可完成换脸视频，耗时不到一秒。 FaceOff 的一个关键特性是它至少保留一个输入表情（在我们的例子中为源），而正如我们稍后展示的，现有方法无法保留任一表情（源表情或目标表情）。
最后，我们对 V2VFaceSwap 进行策划和基准测试，这是一个 V2V 换脸测试数据集，由来自不受约束的 YouTube 视频中未见过的身份、背景和照明条件的实例组成。

$\textbf{我们在这项工作中的贡献}$ 如下：（1）我们引入了V2V面部交换，这是一种新颖的面部交换任务，旨在交换源面部身份和表情，同时保留目标背景和姿势。 (2) 我们提出 FaceOff：一种以自我监督方式训练的 V2V 换脸系统。 FaceOff 通过合并两个不同的面部视频来生成连贯的视频。 (3) 我们的方法在推理时直接作用于看不见的身份，无需任何微调。 (4) 我们的方法不需要任何推理时间优化，推理时间不到一秒。 (5)我们发布了V2VFaceSwap测试数据集，并为V2V换脸任务建立了基准。

2. Related Work

表1 提供了现有任务和 FaceOff 之间的比较。 FaceOff 旨在解决 V2V 换脸的独特挑战，这是以前从未解决过的。

$\textbf{面部交换}$ ：多年来，在图像和视频之间交换面部已得到充分研究\cite{deepfacelabs、fsgan、motion-coseg、simswap、fastfaceswap、faceshifter、faceswapdisney、faceswapphotos、3dmodelfaceswapping}。这些工作旨在将从源视频（或图像）获得的身份与不同身份的目标视频交换，以便在交换的输出中保留所有其他目标特征。
DeepFakes，DeepFaceLabs \cite{deepfacelabs }，并且 FSGAN \cite{fsgan} 交换源的整个身份；
Motion-coseg \cite{motion-coseg} 专门将给定源图像（头发、嘴唇或鼻子等）的单个/多个片段的身份交换到目标视频。
与这些仅交换图像的身份或特定部分的方法不同，我们交换随时间变化的表情以及源的身份。
此外，FSGAN 需要 5 分钟的推理时间优化，DeepFaceLabs 和 DeepFakes 在高端 GPU 上花费高达 24 小时的推理时间优化。 FaceOff 只需不到一秒即可在野外视频中对未见过的身份进行面部交换。

$\textbf{面部操纵}$ ：面部操纵根据给定的先验来对目标图像/视频的姿势和表情进行动画处理 \cite{face-vid2vid、fomm2、fomm、reenactgan、deepfacelabs、flowguided、nvp、makeittalk}。
在音频驱动的说话脸部生成中 \cite{wav2lip, lipgan, wav2lip-emotion,posecont, nvp, pirenderer, vdub}，目标视频中的表情、姿势和唇形同步以给定的输入语音音频为条件。与此类作品不同，我们的方法不假设音频先验。
$\textbf{face reenactment}$ 的不同方向根据驾驶视频 \cite{defererneuralrendering, pirenderer,face2face, deepvideopotraits, fomm, fomm2} 对源面部运动进行动画处理。
在这些作品中，身份并没有被交换。这可以解决我们任务的特殊情况——当目标和源具有相同的身份时。这里，可以根据源视频表情来重新生成目标图像。正如我们在4.2节中所示，与现有方法不同，FaceOff 捕获驾驶视频的微表情。
这是因为我们依赖于混合机制 - 允许驾驶表情的完美转移。
处理这种特殊情况的另一个方向是 $\textbf{人脸编辑}$ ，它涉及编辑人脸视频的表情。使用这种方法，可以根据源表情直接编辑目标视频。
基于图像的人脸编辑作品例如 \cite{pix2pix,stargan,starganv2,cgan}已经获得了相当多的关注。
然而，在不对时间动态进行建模的情况下对帧序列进行这些编辑通常会导致视频在时间上不连贯。最近，STIT \cite{stit} 被提出，可以通过在视频的潜在空间中进行仔细的编辑，将给定的视频连贯地编辑为不同的表情。
尽管取得了成功，但这些技术对表情类型和变异的控制有限。而且，获得与源表情匹配的正确目标表情是手动点击和尝试。 FaceOff 可以添加标签空间中未定义的微表情，只需将同一身份的不同视频中的情感与所需的表情混合即可。

3. FaceOff: Face Swapping in videos

我们的目标是将源面部视频与目标面部视频交换，以便（1）保留源视频的身份和表情，（2）保留目标视频的姿势和背景。为此，我们学习将源人脸视频的前景与目标人脸视频的背景和姿势混合（如图3所示），以使混合输出连贯且有意义。这并非易事，因为它涉及合并两个单独的动议。
请注意，我们的目标只是融合这两种运动；因此，所需的输入特征——身份、表情、姿势和背景——自然地从输入中保留下来，无需额外的监督。主要挑战是对齐前景和背景视频，以便输出形成连贯的身份并具有单一连贯的姿势。所有其他特征都是根据输入重建的。
我们的核心思想是使用时间自动编码模型，使用量化的潜在空间合并这些运动。
总的来说，我们的方法依赖于（1）将两个输入运动编码到量化的潜在空间并在缩减的空间中学习鲁棒的混合操作。
(2)时间和空间相干解码。
(3)在缺乏基本事实的情况下，自我监督的训练方案。

3.1. Merging Videos using Quantized Latents

我们将视频中的换脸作为一个混合问题：给定两个视频作为输入，将视频混合成连贯且有意义的输出。我们依靠编码器将输入视频编码到有意义的潜在空间。我们的整个网络是一个特殊的自动编码器，然后可以学习稳健地混合潜在空间中的缩减视频并生成混合输出。我们仔细选择我们的编码器模型，专注于“混合”而不是学习整体数据分布。具有连续潜在空间的编码器网络减少了给定输入的维度，通常减少到可以被认为是数据的一部分的单个向量。底层分布。这个潜在向量是高度随机的；每个新输入都会生成一个非常不同的潜在向量，引入解码器需要处理的高度变化。最近，\cite{vqvae, vqgan, vqvae2} 中提出了“向量量化” 。量化通过固定可能的潜在代码的数量来减少潜在的变化。然而，使用单个量化潜在向量保留输入属性是不可能的。因此，输入被减少到更高维度的量化空间（例如 $64 \times 64$ ），以便保留完整重建所需的输入属性。我们在我们提出的自动编码器中采用这样的编码器来编码我们的视频。如图2所示，我们的编码器是一个改进的VQVAE2 \cite{vqvae2}编码器，它编码视频而不是图像。为此，我们引入了由非线性 3D 卷积运算组成的时间模块。

我们编码器的输入是通过按通道连接源前景帧和目标背景帧而制成的单个视频，如图3所示。与 VQVAE2 一样，我们的编码器首先将级联视频输入逐帧编码为 $32 \times 32$ 和 $64 \times 64$ 维顶部和底部层次结构。在每个层次结构的量化步骤之前，添加我们的时间模块来处理减少的视频帧。此步骤允许网络通过帧之间的时间连接进行反向传播。然后使用标准 VQVAE2 解码器再次按帧进行进一步处理。在实践中，我们观察到这个时间模块在生成时间相干输出方面发挥着重要作用，正如我们通过 Sec.5 中的消融所示。我们的特殊自动编码器在损失计算步骤中与标准自动编码器不同。 FaceOff 不是重建输入，而是使用六通道视频输入（前三个通道属于源前景，后三个通道属于目标姿势和背景），旨在生成三通道混合视频输出。因此，损失计算是在真实三通道视频和三通道视频输出之间进行的。

3.2. Self-supervised Training Approach

现有的换脸方法使用生成器和鉴别器来训练其网络。这些鉴别器是分类器，指示生成器的输出和基础数据分布（例如身份或表情分布）之间的关系。在这样的设置中，鼓励生成器产生输出的某些方面的幻觉，以匹配鉴别器的数据分布，从而使其输出新的身份或表情。我们在Fig.4中展示了这种现象。可以使用指示精确的输出与地面实况关系的硬距离损失（例如，欧几里德距离）而不是随机鉴别器损失来克服这个问题。在V2V换脸中，保留准确的源表情至关重要。因此，我们通过设计一种自监督训练方案来使用距离损失来训练我们的网络，该方案迫使网络重建给定输入视频的去噪版本。

为了理解训练方案，我们首先看看在尝试简单地混合两个动作时遇到的挑战。
首先，源视频和目标视频中的面部之间存在全局和局部姿势差异。我们通过使用人脸地标根据目标姿势对齐（旋转、平移和缩放）源姿势来修复全局姿势差异，如图3所示。然而，局部姿势差异并不能通过这种方式克服，并且我们观察到帧之间的时间不连贯性。接下来，我们观察前景和背景颜色（光照、色调、饱和度和对比度）的差异。因此，我们通过在训练期间重现这些错误来训练我们的网络来解决这些已知问题。如图2所示，
我们通过以下方式训练我们的模型：
(1) 拍摄一段视频，比如 $s$ 。
(2) 从 $s$ 中提取人脸区域，比如 $f$ ；和背景区域，比如 $b$ 。
(3) 在 $f$ 上引入伪错误（旋转、颜色、比例等）。
(4) 通过在每个相应帧按通道连接 $f$ 和 $b$ 来构造输入 $v$ 。
(5) 训练网络从 $v$ 构造 $s$ 。尽管我们在自监督方案中使用相同的身份来训练网络，但它可以在推理时直接交换看不见的身份，而无需任何微调。

3.3. Reproducing Inference Errors at Training

给定两个头部说话视频，源视频和目标视频，分别用 $S$ 和 $T$ 表示，我们的目标是生成一个输出，保留 (1) $S$ 的身份和情感以及 (2) 姿势和背景来自 $T$ 。我们假设 $S$ 和 $T$ 中的帧数（用 $N$ 表示）相等。给定两个帧， $s_i \in S$ 和 $t_i \in T$ ，使得 $i = 1... N$ ，我们表示 $f_{s_i} \in F_s$ 和 $b_{t_i} \in B_t$ 分别作为 $s_i$ 和 $t_i$ 的前景和背景。给定 $F_s$ 和 $B_t$ 作为输入，网络修复了以下问题：

首先，网络遇到 $f_{s_i}$ 和 $b_{t_i}$ 之间的局部姿态差异。这种姿势差异可以使用仿射变换函数来修复： $\delta(f_{s_i}, b_{t_i}) = m(rf_{s_i} + d) + m(rb_{t_i} + d)$ 其中 $m$ 、 $r$ 和 $d$ 表示缩放、旋转和平移。面是一个非刚体；仿射变换只会导致两张脸的姿势完美匹配，但形状不匹配。人们可以想象尝试将一个正方形放入一个圆中。首先需要一个非线性函数将正方形转换为类似于圆形的形状，以便它们适合。我们将这种非线性变换表示为可学习函数 $\omega(f_{s_i}, b_{t_i})$ 。由于是非线性的，只要两个人脸都适合，网络就可以对输入帧执行此类变换。可以使用距离损失来约束这些变换，以鼓励生成有意义的帧的空间一致的变换。然而，这些空间一致的变换在整个视频中可能是时间不相干的。这将导致视频中的脸部摇晃，如 Sec.5 所示。因此，我们将变换约束为 $\omega(f_{s_i}, b_{t_i}, f_{s_k}, b_{t_k})$ ，其中 $k = 1.. N$ 使得 $\ne i$ 。这里，当前帧的变换受到视频中所有其他帧的变换的约束。这是由时间模块启用的，如 Sec.3.1中所述。
最后，网络遇到 $f_{s_i}$ 和 $b_{t_i}$ 之间的颜色差异，该差异被固定为 $c(f_{s_i}, b_{t_i})$ 。

如图2所示，训练时 $S = T$ 。对于每个帧 $s_i \in S$ ，我们首先提取前景 $f_{s_i} \in F_s$ （充当源）和背景 $b_{t_i} \in B_t$ （充当目标） ) 来自 $s_i$ 。接下来，我们在 $f_{s_i}$ 上应用随机旋转、平移、缩放、颜色和扭曲（桶状、胡须）错误。然后将训练设置表述为：
$\begin{gather} \Phi: \Omega(\delta, \omega, c)\\ J = \frac{1}{N}\sum_{i = 1}^{N} [ s_i - \Phi(f_{s_i}, b_{t_i}, f_{s_k}, b_{t_k})] + P(F_s, B_t) \end{gather}$ 其中 $\Omega$ 是可学习函数， $J$ 是要最小化的网络总体成本， $P$ 是感知度量（在我们的例子中为 LPIPS~\cite{lpips}）， $\dots N$ 使得 $\neq i$ 。

4. Experiments and Results

在本节中，我们尝试回答以下问题：（1）与替代方法相比，我们如何更好地保留源身份？（2）我们如何很好地保留输入视频的表情？ (3) 与其他技术相比，FaceOff 的效率如何？

我们将 FaceOff 与不同的任务进行比较：“换脸”、“脸部重演”和“脸部编辑”。请注意，这些方法都不能完全解决我们想要解决的 V2V 换脸任务。具体来说，V2V 换脸的目的是（1）交换源身份和表情，（2）保留目标姿势和背景。

$\textbf{定量指标：}$
$\textbf{(1)} \textbf{S}ource-\textbf{P}rediction \ \textbf{I}dentity \ \textbf{Dis}tance \textbf{(SPIDis)}$ ：计算人脸图像之间的身份差异。它被计算为使用 dlib 的人脸检测模块生成的人脸嵌入之间的欧几里德距离。
$\textbf{(2)} \textbf{F}réchet \ \textbf{V}ideo \ \textbf{D}istance \textbf{(FVD)}$ ，如 \cite{fvd} 中提出的，计算生成视频中的时间相干性输出。
$\textbf{(3)} \textbf{L}and\textbf{m}ark \ \textbf{D}istance \textbf{(LMD)}$ ：评估源和交换输出的整体面部结构和表情。为了计算 LMD，源和交换的面部标志被归一化：面部首先居中，然后绕 x 轴旋转，以便质心和眼睛坐标之间的角度对齐平均图像。接下来，将面部缩放至平均图像。标准化交换和源视频地标之间的欧几里德距离给出了 LMD。我们计算源面部表情和输出面部表情之间的 LMD（不包括面部许可者的地标）。
$\textbf{(4)} \textbf{T}emporally \ \textbf{L}ocally \textbf{(TL-ID)} 和 \textbf{T}emporally \ \textbf{G}lobally \textbf{(TG-ID)} \ \textbf{Id}entity \ Preservation$ ：在 \cite{stit} 中提出。他们评估视频在本地和全球层面的身份一致性。对于这两个指标，得分为 1 表示该方法成功地保持了原始视频的身份一致性。

$\textbf{定性指标：}$ $\textbf{(1)} \textbf{Identity}$ 的平均绝对意见得分，范围为 $1 - 10$ 报告：交换输出身份与源身份的相似程度如何？ $\textbf{(2)} 表情 \textbf{(Exps.)}$ ：交换输出表情与源表情有多相似？和 $\textbf{(3)} 自然度 \textbf{(Ntrl.)}$ ：是生成的输出自然吗？

$\textbf{实验数据集}$ ：我们对由不受约束的 YouTube 视频组成的 V2VFaceSwap 数据集进行基准测试，这些视频具有许多看不见的身份、背景和照明条件。补充论文报告了有关数据集和评估设置的更多详细信息。

4.1. Face-Swapping Results

Fig.5和 Table2分别展示了现有方法和 FaceOff 之间的定性和定量比较。 Fig.6演示了 FaceOff 在视频上的换脸结果。
如图5所示，FaceOff成功交换了源人脸视频的身份和表情。现有方法无法交换源表情，这表明 FaceOff 解决了 V2V 换脸的独特挑战。我们实验的一个有趣发现是，现有方法不会在输出中保留任何输入表情（源或目标）并生成新颖的表情，例如新颖的注视方向或嘴巴运动。这种现象也在Fig.4中得到了证明。 FSGAN 和 Motion-Coseg 无法完全交换身份。这通过 Table2中的定量指标得到进一步证实。 FaceOff 在 SPIDis 和 LMD 上比 FSGAN 有 $\sim 22\%$ 和 $\sim 28\%$ 的改进，表明 FaceOff 的优越性。

FSGAN 实现了稍微更好的 FVD，并且在人类评估中被认为更自然。这是预期的，因为 FSGAN 不会对目标身份进行太大改变，并保留原始目标视频，使其观察起来更加自然。 FaceOff 几乎完美地交换了身份。此外，现有方法仅需要遵循单个目标运动。 FaceOff 解决了运动到运动交换的另一个挑战，即需要在每一帧上进行源-目标姿势对齐。这需要 FaceOff 生成新颖的动作，使动作中的身份、表情和姿势看起来自然并与输入相匹配。尽管存在这一挑战，FSGAN 和 FaceOff 的 FVD 之间的差异在感知上并不显着 \cite{fvd}。
DeepFaceLabs 和 DeepFakes 可以很好地交换身份，但计算成本比 FaceOff 贵 9000 倍，这使得 FaceOff 在现实世界中更具可扩展性和适用性。

4.2. Target Face Manipulation Results

假设源和目标具有相同的身份，问题就简化为以下内容：将表情从源视频传输到目标视频。这从根本上是“面部重演”的设置。人们还可以通过识别和量化源表情并使用“面部编辑”网络来编辑目标表情来修改目标的表情。图7展示了 FaceOff、“面部重演”（Face-Vid2Vid）和“面部编辑”（STIT）之间的定性比较。

$\textbf{面部重演}：$
我们与 Face-Vid2Vid \cite{face-vid2vid} 进行比较，这是一种 SOTA 人脸重演网络，它使用源（驾驶）视频重演目标图像的姿势和表情。如图7所示，FaceOff 保留了来源的微表情，例如准确的张嘴和皱眉。 FaceOff 依赖于确定性距离损失，因此它可以在输出中保留精确的输入表情。此外，FaceOff 保留时间目标姿势和背景，而 Face-Vid2Vid 修改静态帧。

$\textbf{脸部编辑：}$
使用强大的神经网络，人们可以通过执行编辑在视频中引入所需的表情。
我们将我们的方法与 STIT \cite{stit} 进行比较。 STIT 根据输入标签修改面部视频的表情。我们观察源表情并手动尝试“微笑”情绪的各种强度，从消极到积极。
如图7所示，虽然STIT可以改变整体表情，但它需要手动尝试来确定准确的表情。它还缺乏个性化的表情（张嘴的次数、微妙的眉毛变化）。此外，每个表情都不能使用单一标签来定义，并且沿着时间维度引入情感变化也很困难。通过我们提出的方法，人们可以在视频中融入任何情感（只要我们能够访问源视频）。

5. Ablation Study

我们研究了不同模块和错误在实现 FaceOff 过程中的贡献。
Fig.8 演示了在没有所提出的时间模块的情况下 FaceOff 的性能。如图所示，虽然在帧级别，输出是空间相干的，但当我们查看帧时，我们可以注意到时间不相干。这张脸似乎在画面上“摇晃”——上下挤压。事实上，如果没有时间模块，网络就无法理解整体面部结构并生成不自然的帧（以红色标记）。从一个红色方框跳到另一个红色方框，我们可以看到脸部结构完全改变了。这表明使用时间模块通过相邻帧约束网络使网络能够学习全局形状拟合问题，从而生成时间相干的输出。

表3展示了时间模块的定量贡献以及用于自监督训练的每个错误。这些指标表明，它们中的每一个都对实现 FaceOff 做出了重大贡献。

6. Conclusion

我们引入了“视频到视频（V2V）面部交换”，这是一种新颖的面部交换任务。与面部交换不同的是，面部交换旨在将源面部视频（或图像）中的身份交换到目标面部视频中，V2V换脸的目的是在交换源表情的同时交换身份。
为了解决这个问题，我们提出了 FaceOff，这是一种自我监督的时间自动编码网络，它以两个面部视频作为输入并产生单个连贯的混合输出。如实验部分所示，FaceOff 比现有方法更好地交换源身份，同时计算效率也达到 400 倍。它还交换了任何方法都无法做到的确切源身份。 V2V换脸有很多应用；一个重要的应用是自动执行用电影中演员的身份和表情替换替身面孔的任务。我们相信我们的工作为电影剪辑增添了一个全新的维度，有可能节省数月繁琐的手动工作和数百万美元。

15个小技巧，让我的Windows电脑更好用了！曹元_
01.桌面及文档处理第一部分的技巧，主要是围绕桌面的一些基本操作，包括主题设置、常用文档文件快捷打开的多种方式等等。主题换色默认情况下，我们的Win界面可能就是白色的文档界面，天蓝色的图表背景，说不出哪里不好看，但是就是觉得不够高级。imageimage说到高级感，本能第一反应就会和暗色模式联想起来，如果我们将整个界面换成黑夜模式的话，它会是这样的。imageimage更改主题颜色及暗色模式，我们
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
2022-04-07 上善若水1979527
昨天苏阿姨来给我送普门品！和她一块来的还有另外一个阿姨！我下去拿时！那阿姨说你不是干房产的小赵！帮我租房的！我说你认识我？对啊！你帮我租的房子！我没印象了！我和保红一块！我说我想起来了阿姨！你这运动服一换！小电车一骑！一下年轻十岁我早记不得了！我只记得一九年五一带看了河滨美航还有德胜的好多套房子！你都不当意！你告诉我你每晚拜观音菩萨说快让小赵普萨帮我找套合适的房子吧！我把本子上记得半年内的德胜房源
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
Selenium 特殊控件操作与 ActionChains 实践详解小馋喵知识杂货铺 selenium 测试工具
1.下拉框单选操作(a)使用SeleniumSelect类（标准HTML标签）Selenium提供了内置的Select类用于操作标准下拉框，这种方式简单且直观。fromselenium.webdriver.support.uiimportSelect#定位下拉框dropdown=Select(driver.find_element("id","dropdown_id"))#通过以下三种方式选择单个
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具文章来源：PoixeAI文章目录Zread.AI工具概述核心功能优势亮点典型应用场景上手指南注意事项官网地址Zread.AI由智谱Z.ai推出，是一款面向开发者的AI代码维基工具，可在几秒内把任何公开GitHub仓库转化为结构化中文手册，并通过独家Buzz面板聚合commits、issues与相关新闻，让项目脉搏一目了然
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
张长玲碎嘴惹闲气，郭德旺无心泄天机【三】南山顽石
玲玲便紧紧靠在他身边不情不愿地继续朝前走，一边走一双手却一边不太安分的在他身上摩挲起来。突然，她的一只手伸进了他的衣袋里，紧接着又出来，却已捏着个东西，口中欢叫起来：“啊！你有这，咋不早说？”瑞年朝她手上一看说：“气球嘛，有啥稀奇？”“你瓜呀！”玲玲笑道，“这是biyuntao，我在我大嫂子屋里见过的，想偷偷拿几个呢，又没好意思。”瑞年停下脚步问道：“啥是biyuntao？”李玲玲看他半日，把脸微
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元 Liudef06小白特殊专栏 AIGC 人工智能 AI作画人工智能 AIGC
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元随着多模态AI技术的爆发式发展，StableDiffusionXL（SDXL）等文生图模型正在彻底重塑创意产业工作流。本文将深入解析如何在魔搭平台高效训练SDXL模型，并探讨AI绘画技术对设计行业的革命性影响。一、SDXL模型架构解析1.1双文本编码器设计SDXL采用双文本编码器架构，显著提升提示词理解能力：#SDXL文本编码器结构示意c
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的

【论文精读WACV_2023】FaceOff: A Video-to-Video Face Swapping System

【论文精读WACV_2023】FaceOff: A Video-to-Video Face Swapping System

一、前言

Abstract

1. Introduction

2. Related Work

3. FaceOff: Face Swapping in videos

3.1. Merging Videos using Quantized Latents

3.2. Self-supervised Training Approach

3.3. Reproducing Inference Errors at Training

4. Experiments and Results

4.1. Face-Swapping Results

4.2. Target Face Manipulation Results

5. Ablation Study

6. Conclusion

你可能感兴趣的:(CV,AI换脸,face,swapping,计算机视觉,机器学习,论文精读)