EDPJ

（2023|ICML，解耦表示，多条件生成，扩散）Composer：使用合成条件进行创意和可控图像合成

Composer: Creative and Controllable Image Synthesis with Composable Conditions

公众号：EDPJ（添加 VX：CV_EDPJ 或直接进 Q 交流群：922230617 获取资料）

0. 摘要

1. 简介

2. 方法

2.1. 扩散模型

2.2. 分解

2.3. 组合

3. 实验

3.1. 训练细节

3.2. 图像操控

3.3. 传统生成任务的改进

3.4. 组合式图像生成

3.5. 文本到图像生成

4. 相关工作

5. 结论和讨论

附录

A. 架构详细信息

B. 条件模块

S. 总结

S.1 主要贡献

S.2 架构和方法

S.3 应用

0. 摘要

最近，在大规模数据上学习的生成模型能够合成令人难以置信的图像，但受限于有限的可控性。这项工作提供了一种新的生成范例，允许对输出图像进行灵活的控制，如空间布局和调色板，同时保持合成质量和模型创造力。以组合性作为核心思想，我们首先将图像分解为代表性因素，然后使用所有这些因素作为条件来扩散模型，以重新组合输入。在推断阶段，丰富的中间表示作为可组合的元素，导致了一个庞大的设计空间（与分解因素的数量成指数比例）以进行可定制的内容创建。值得注意的是，我们的方法，我们称之为 Composer，支持各种级别的条件，例如全局信息的文本描述，作为局部指导的深度图和草图，用于低级细节的颜色直方图等。除了提高可控性，我们确认 Composer 作为一个通用框架，有助于各种经典生成任务而无需重新训练。代码和模型将会提供。

1. 简介

"The infinite use of finite means." ——Noam Chomsky (Chomsky, 1965)

生成图像模型在文本条件下现在可以产生逼真且多样的图像（Ramesh等，2022; Saharia等，2022; Rombach等，2021; Yu等，2022; Chang等，2023）。为了进一步实现定制化的生成，许多最近的作品通过引入条件，如分割图（Rombach等，2021; Wang等，2022b; Couairon等，2022），场景图（Yang等，2022），素描（Voynov等，2022），深度图（stability.ai，2022），修补掩码（Xie等，2022; Wang等，2022a），或通过在一些特定主题的数据上微调预训练模型（Gal等，2022; Mokady等，2022; Ruiz等，2022），来扩展文本到图像模型。然而，这些模型在实际应用中仍然只提供了有限的可控性。例如，生成模型经常难以准确地同时产生具有语义、形状、风格和颜色规格的图像，这在现实世界的设计项目中很常见。

我们认为，可控的图像生成关键不仅取决于条件，更重要的是组合性（Lake等，2017）。后者可以通过引入大量的潜在组合（例如，每个包含八种表示的一百张图像大约产生 100^8 种组合）来指数级地扩展控制空间。类似的概念在语言和场景理解领域得到了探索（Keysers等，2019; Johnson等，2016），在这些领域，组合性被称为组合泛化（compositional generalization），即从有限数量的已知组件中识别或生成潜在无限数量的新组合的技巧。

在这项工作中，我们开发了 Composer，这是组合生成模型的实现。组合生成模型指的是能够无缝重组视觉组件以创建新图像的模型。具体而言，Composer 是一个具有 UNet 骨干的多条件扩散模型。在 Composer 的每次训练迭代中，有两个阶段。在分解阶段中，一批图像会使用计算机视觉算法或预训练模型分解成各个独立的表示形式。在合成阶段，Composer 经过优化，可以从这些表示子集中重建这些图像。尽管只使用重建目标进行训练，Composer 可以解码由来自不同来源并且可能不兼容的表示组合组成的新图像。

尽管在概念上简单且易于实施，Composer 表现出了强大的性能，并在一系列图像生成和处理任务中取得了令人鼓舞的成绩，包括传统任务和以前未曾探索的任务。这些任务包括文本到图像生成、多模态条件图像生成、风格转移、姿势转移、图像翻译、虚拟试穿、不同方向的插值和图像变化、通过修改素描、深度或分割图来重新配置图像、根据可选调色板进行着色等。Composer 引入了掩模的正交表示，使其能够将可编辑区域限制在用户指定的区域。这种方法比传统的修复操作更灵活，同时可以防止修改指定区域外的像素。虽然 Composer 以多任务的方式训练，但在仅使用标题作为条件时，在 COCO 数据集上实现了零样本文本到图像合成 FID 为 9.2，表明它能够产生高质量的输出。

2. 方法

我们的框架包括分解阶段，其中图像被分解成一组独立的组件；以及组合阶段，其中使用条件扩散模型重新组装这些组件。首先，我们对扩散模型和 Composer 提供的指导方向进行简要介绍。随后，我们详细解释了图像分解和组合的实现方式。

2.1. 扩散模型

扩散基础。

无分类器引导（classifier-free guidance）。

双向指导：通过使用条件 c_1 将图像 x_0 逆映射到其潜在 x_T，然后使用另一个条件 c_2 从 x_T 进行采样，我们能够使用 Composer 以分离的方式来操纵图像，其中操纵方向是由操作方向 c_1 和 c_2 定义的。这一方法在（Wallace等，2022）中被用到。我们在第 3.2 节和第 3.3 节使用这种方法。

2.2. 分解

我们将图像分解成捕捉其各个方面的解耦表示。我们在这项工作中使用了八种表示，它们都是在训练过程中实时提取的。

标题：我们直接使用图像文本训练数据中的标题（title）或描述信息（例如，LAION-5B（Schuhmann等，2022））作为图像标题（caption）。当没有标注可用时，也可以利用预训练的图像标题模型。我们使用预训练的 CLIP ViT-L/14@336px（Radford等，2021）模型提取它们的句子和单词嵌入来表示这些标题。
语义和风格：我们使用预训练的 CLIP ViT-L/14@336px（Radford等，2021）模型提取的图像嵌入来表示图像的语义和风格，类似于 unCLIP（Ramesh等，2022）。
颜色：我们使用平滑的 CIELab 直方图（Sergeyk，2016）表示图像的颜色统计信息。我们将 CIELab 颜色空间量化为 11 个色调值，5 个饱和度值和 5 个亮度值，并使用 10 的平滑 sigma。我们经验性地发现这些设置效果很好。
素描：我们使用边缘检测模型（Su等，2021）和素描简化算法（Simo-Serra等，2017）提取图像的素描。素描捕捉图像的局部细节，具有较少的语义。
实例：我们使用预训练的 YOLOv5（Jocher，2020）模型对图像进行实例分割，提取其实例掩模。实例分割掩模反映了视觉对象的类别和形状信息。
深度图：我们使用预训练的单目（monocular）深度估计模型（Ranftl等，2022）提取图像的深度图，粗略捕捉图像的布局。
强度：我们引入原始的灰度图像作为一种表示，以迫使模型学习操纵颜色的解耦自由度。为了引入随机性，我们从一组预定义的 RGB 通道权重中均匀采样以创建灰度图像。
掩模：我们引入图像掩模，以使 Composer 能够将图像生成或操作限制在可编辑的区域。我们使用一个 4 通道表示，其中前 3 个通道对应于掩掩模的 RGB 图像，而最后一个通道对应于二进制掩模。

值得注意的是，虽然这项工作使用了上述的八种条件进行实验，但用户可以自由地使用 Composer自定义其条件。

2.3. 组合

我们使用扩散模型从一组表示中重新合成图像。具体来说，我们利用 GLIDE（Nichol等，2021）架构并修改其条件模块。我们探索了两种不同的机制来使模型以我们的表示为条件：

全局条件：对于全局表示，包括 CLIP 句子嵌入、图像嵌入和色彩调色板，我们将它们投影并添加到时间步嵌入中。此外，我们将图像嵌入和色彩调色板投影到八个额外的标记中，并将它们与 CLIP 单词嵌入连接起来，然后用作 GLIDE 中交叉注意力的上下文，类似于 unCLIP（Ramesh等，2022）。由于条件要么是加法的，要么可以在交叉关注中进行选择性掩蔽，因此要么在训练和推断期间删除条件，要么引入新的全局条件都是直截了当的。

局部条件：对于局部表示，包括素描、分割掩码、深度图、强度图像和带掩码图像，我们使用堆叠的卷积层将它们投影到与有噪潜在 x_t 具有相同空间大小的均匀维度嵌入中。然后，我们计算这些嵌入的总和，并将结果连接到 x_t，然后馈送到 UNet 中。由于这些嵌入是加法的，因此很容易适应缺失条件或引入新的局部条件。

联合训练策略：设计一个联合训练策略至关重要，使模型能够学会从各种条件组合中解码图像。我们尝试了几种配置，并确定了一种简单而有效的配置，其中我们为每个条件使用独立的 0.5 的丢弃概率，0.1 的概率丢弃所有条件，以及 0.1 的概率保留所有条件。对于强度图像，我们使用特殊的 0.7 的丢弃概率，因为它们包含大多数关于图像的信息，可能在训练期间压制其他条件。

基础扩散模型生成 64x64 分辨率的图像。为了生成高分辨率图像，我们训练了两个无条件的扩散模型，用于分别将图像从 64x64 分辨率放大到 256x256 和从 256x256 分辨率放大到 1024x1024。放大模型的架构是从 unCLIP（Ramesh等，2022）修改而来的，其中我们在低分辨率层中使用更多通道，并引入自注意力块以扩大容量。我们还引入了一个可选的先验模型（Ramesh等，2022），用于从标题生成图像嵌入。我们经验性地发现，对于某些条件的组合，先验模型能够提高生成图像的多样性。

3. 实验

3.1. 训练细节

我们训练了一个包含 2B 参数的基础模型，用于在 64x64 分辨率下进行有条件的图像生成，一个包含 1.1B 参数的模型，用于将图像上采样到 256x256 分辨率，以及一个包含 0.3B 参数的模型，用于将图像进一步上采样到 1024x1024 分辨率。此外，我们还训练了一个包含 1B 亿参数的先验模型，用于将标题可选地投影到图像嵌入。对于先验、基础和两个上采样模型，我们分别使用了 4096、1024、512 和 512 的批大小。我们在一系列公共数据集上进行训练，包括 ImageNet21K（Russakovsky等，2014）、WebVision（Li等，2017），以及包含大约 1B 图像的 LAION 数据集（Schuhmann等，2022）的筛选版本。我们从 LAION 数据集中消除了重复项、低分辨率图像和潜在包含有害内容的图像。对于基础模型，我们首先使用仅图像嵌入作为条件，在完整数据集上进行了 100 万步的预训练，然后启用了所有条件，在原始数据集的 6000 万示例子集（排除审美评分 7.0 以下的 Laion 图像）上进行了 20 万步的微调，同时。先验模型和上采样模型在完整数据集上进行了 100 万步的训练。

3.2. 图像操控

变化：使用 Composer，我们可以通过以给定图像表示的特定子集作为条件，来创建类似于给定图像但在某些方面不同的新图像。通过精心选择不同表示的组合，我们可以在图像变化的范围上具有很大的灵活性（图 2a）。当引入更多条件时，我们的方法比仅基于图像嵌入进行条件化的 unCLIP（Ramesh等，2022）容易产生更准确的重建图像。

插值：通过在两个图像全局表示之间的嵌入空间中遍历，我们可以混合这两个图像以进行变化。Composer 进一步让我们精确控制要在两个图像之间插值的元素以及要保持不变的元素，从而产生多种插值方向（图 2b）。

重配置：图像重配置（Sun＆Wu，2019）是指通过直接修改一个或多个图像的表示来操作图像。Composer 提供了各种图像重配置的选项（第 2.1 节）。具体来说，给定一个图像 x，我们可以通过以图像的一组表示 c_i 为条件的 DDIM 反演来获得其潜在 x_T；然后，我们从 x_T 开始，通过以一组修改后的表示 c_j 为条件进行 DDIM 采样，以获得图像的变体 ^x。 ^x 预计会与 x 在由 c_j 和 c_i 之间的差异定义的变化方向上不同，但除此之外它们是相似的。通过按照这个过程，我们能够从不同的方向操纵图像（图 3）。

可编辑区域：通过以一组表示 c 以及一个掩码图像 m 为条件，Composer 可以将变化限制在由 m定义的区域内。值得注意的是，可编辑区域与所有图像生成和操作操作都是正交的，为 Composer 提供了比单纯的图像修补更大的图像编辑灵活性（图 4）。

3.3. 传统生成任务的改进

可以使用 Composer 架构来重新制定许多传统的图像生成和操作任务。以下是一些示例。

基于调色盘的上色: 在使用 Composer 根据调色板 p 上色图像 x 时，有两种方法：一种方法涉及将采样过程的条件设置为 x 的灰度版本和 p，而另一种方法涉及使用重新配置（第 3.2 节）来根据调色板对 x 进行操作。我们发现后一种方法产生更合理和多样的结果，因此在图 5a 中使用了它。

风格迁移: Composer 粗略地分离了内容和样式表示，这使我们能够将图像 x1 的样式转移到另一个图像 x2，只需以 x1 的样式表示和 x2 的内容为条件。还可以通过在两个图像之间插值样式表示来控制迁移强度。我们在图 5b 中展示了示例。

图像转换: 图像转换是指将图像转化为内容保持不变，但样式转换以匹配目标领域的变体的任务。我们使用图像的所有可用表示来描述其内容，并使用文本描述来捕获目标领域。我们利用第 3.2 节中描述的重新配置方法来操作图像（图 5c）。

姿势迁移: 图像的 CLIP 嵌入捕获其样式和语义，使 Composer 能够修改对象的姿势而不损害其身份。我们使用对象的分割图来表示其姿势，使用图像嵌入来捕获其语义，然后利用第 3.2 节中描述的重新配置方法来修改对象的姿势（图 5d）。

虚拟试穿: 鉴于服装图像 x1 和身体图像 x2，我们可以首先遮蔽 x2 中的服装，然后以掩蔽图像 m2 以及给定图像 x1 的 CLIP 图像嵌入为条件进行采样，以产生虚拟试穿的结果（图 5e）。尽管质量适中，但结果展示了 Composer 处理具有统一框架的困难问题的可能性。

3.4. 组合式图像生成

通过以不同来源的各种视觉元素的组合为条件，Composer 可以从有限的材料集生成大量的图像。图 6 显示了一些精选示例。

3.5. 文本到图像生成

为了进一步评估 Composer 在图像生成方面的质量，我们将其与 COCO 数据集（Lin等，2014）上最先进的文本到图像生成模型进行了比较。我们使用 100、50 和 20 个采样步骤分别用于先验、基础和 64×64 到 256×256 上采样模型，先验和基础模型使用 3.0 的引导系数。尽管它是多任务训练的，Composer 在 COCO 上达到了竞争力的 FID 分数为 9.2，CLIP 分数为 0.28，与表现最佳的模型相媲美。

4. 相关工作

扩散模型（Ho等，2020；Nichol＆Dhariwal，2021；Dhariwal＆Nichol，2021；Rombach等，2021；Nichol 等，2021；Ramesh等，2022；stability.ai，2022；Saharia 等，2022）正逐渐成为图像生成的成功范式，超越了GAN（Xu等，2017； Zhu等，2019；Zhang等，2021），并在保真度和多样性方面与自回归模型（Ramesh等，2021；Yu等，2021；Esser等，2020；Yu等，2022；Ding等，2021）相当。

我们的方法建立在最近的分层扩散模型（Ramesh等，2022；Saharia 等，2022）基础之上，其中一个大型扩散模型用于生成小分辨率图像，而两个相对较小的扩散模型将图像上采样到更高的分辨率。然而，与这些文本到图像模型不同，我们的方法支持可组合的条件，并具有更好的灵活性和可控性。

许多最新的工作扩展了预训练的文本到图像扩散模型，以实现多模态或定制生成，通常通过引入条件，如修补掩模（Xie等，2022；Wang等，2022a），素描（Voynov等，2022），场景图（Yang等，2022），关键点（Li等，2023），分割图（Rombach 等，2021；Wang等，2022b；Couairon等，2022），多个文本描述的组合（Liu等，2022）以及深度图（stability.ai，2022），或通过在一些特定主题数据上微调参数（Gal等，2022； Mokady等，2022；Ruiz等，2022）。此外，基于 GAN 的方法还可以接受多种条件的组合，以实现可控的生成（Huang等，2021）。与这些方法相比，Composer 在各种条件下都具备组合性，能够扩大控制空间，在图像生成和操作方面具有更大的灵活性。

5. 结论和讨论

我们的分解-组合范式表明，当条件可组合而不是独立使用时，生成模型的控制空间可以大幅扩展。因此，可以使用我们的 Composer 架构重新构思广泛的传统生成任务，并展现了先前未探索的生成能力，激发了对各种分解算法的进一步研究，这些算法可以实现更高的可控性。此外，我们提出了多种利用 Composer 进行图像生成和操作任务的方法，基于无分类器和双向引导，为未来研究提供了有用的参考。

尽管在第 2.3 节中我们经验性地找到了一种简单而可行的多条件联合训练配置，但这种策略并不完美，例如，它可能会降低单条件生成的性能。例如，如果没有全局嵌入，基于素描或深度的生成通常会产生相对较暗的图像。另一个问题是，在出现不兼容的条件时可能会存在冲突。例如，当具有不同语义的图像和文本嵌入一起使用时，生成的结果通常会降低文本嵌入的权重。

以前的研究（Nichol等，2021；Ramesh等，2022；Saharia等，2022）强调了与图像生成模型相关的潜在风险，如具有欺骗性和有害内容。Composer 在可控性方面的改进进一步增加了这种风险。我们打算在将该工作公之于众之前，彻底调查 Composer 如何减轻滥用的风险，可能会创建一个经过筛选的版本。

附录

A. 架构详细信息

B. 条件模块

Composer 的全局条件模块如上图所示。对于全局条件，如 CLIP 句子嵌入、图像嵌入和颜色直方图，我们将它们投影并添加到时间步嵌入中。此外，我们将图像嵌入和颜色调色板投影到八个额外的标记，并将它们与 CLIP 单词嵌入连接起来，然后将它们用作交叉注意力层的上下文输入。

Composer 的局部条件模块如上图所示。对于局部条件，如分割图、深度图、素描、灰度图像和掩膜图像，我们使用堆叠卷积层将它们投影到具有与有噪图像相同空间尺寸的均匀维度嵌入中。随后，我们计算这些嵌入的总和并将结果连接到有噪图像。

S. 总结

S.1 主要贡献

本文提出 Composer，以组合性作为核心思想，首先将图像分解为代表性因素，然后使用所有这些因素作为扩散模型的条件，以重新组合输入。

S.2 架构和方法

分解。本文将图像分解成捕捉其各个方面的八个解耦表示（除此之外，用户可以自定义条件）：标题、语义和风格、颜色、素描、实例、深度图、强度（灰度图）、掩模。

组合。使用扩散模型从一组表示中重新合成图像。具体来说，利用 GLIDE 架构并修改其条件模块。本文探索了两种不同的机制来使模型以表示为条件：

1) 全局条件：对于全局表示，包括 CLIP 句子嵌入、图像嵌入和色彩调色板，将它们投影并添加到时间步嵌入中。此外，将图像嵌入和色彩调色板投影到八个额外的标记中，并将它们与 CLIP 单词嵌入连接起来，然后用作 GLIDE 中交叉注意力的上下文。

2) 局部条件：对于局部表示，包括素描、分割掩码、深度图、强度图像和带掩码图像，使用堆叠的卷积层将它们投影到与有噪潜在具有相同空间大小的均匀维度嵌入中。然后，计算这些嵌入的总和，并将结果连接到有噪潜在，然后馈送到 UNet 中。

整体架构包括一个生成低分辨率图像的基础模型、两个上采样超分辨率模型，以及一个可以将标题映射到图像嵌入的先验模块。

S.3 应用

图像操控。

变化：以给定图像表示的特定子集作为条件，通过选择不同组合来生成变化的图像。
插值：控制两个图像之间插值的元素以及要保持不变的元素，从而产生多种插值方向。
重配置：给定图像，基于其一组表示，以 DDIM 反演来获得其有噪潜在；然后，从有噪潜在开始，以一组修改的表示为条件进行 DDIM 采样，以获得图像的变体。
区域编辑：基于掩模的图像编辑。

传统任务：基于调色盘色上色、风格迁移、图像转换、姿势迁移、虚拟试穿等。

数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
基于深度学习的目标检测算法综述：从RCNN到YOLOv13，一文看懂十年演进！人工智能教程深度学习目标检测算法人工智能自动驾驶 YOLO 机器学习
一、引言：目标检测的十年巨变2012年AlexNet拉开深度学习序幕，2014年RCNN横空出世，目标检测从此进入“深度时代”。十年间，算法从两阶段到单阶段，从Anchor-base到Anchor-free，从CNN到Transformer，从2D到3D，从监督学习到自监督学习，迭代速度之快令人目不暇接。本文将系统梳理基于深度学习的目标检测算法，带你全面了解技术演进、核心思想、代表算法、工业落地与
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版）
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版））工业相机使用YoloV8模型实现不同水果的检测识别工业相机通过YoloV8模型实现不同水果的检测识别的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入Yo
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
人工智能概念之九：深度学习概述
文章目录相关文章一、深度学习的定位：AI时代的基石技术1.1技术生态全景图1.2技术革命的催化剂二、深度学习的双面性：性能优势与技术挑战2.1技术优势全景扫描2.2技术挑战深度剖析三、技术演进时间轴：70年的厚积薄发四、主流框架生态对比五、未来演进方向相关文章人工智能概念之二：人工智能核心概念：网页链接一、深度学习的定位：AI时代的基石技术1.1技术生态全景图深度学习处于人工智能（AI）技术金字塔
学苑教育杂志《学苑教育》杂志社学苑教育编辑部2025年第21期目录 QQ296078736 人工智能
专题研究推进“教-学-评”一体化，打造小学语文高效课堂刘月兰;4-6教育管理新高考制度下普通高中生涯教育课程设计的研究霍亚贞;马玲;7-9课堂教学核心素养下小学数学深度学习课堂的构建策略康贵景;10-12“双减”背景下初中英语教学的课堂模式高燕;13-15小学低年级数学说理课堂构建策略玉洁;16-18基于法治观念培育的道法课项目式教学策略许静;19-21“双师课堂”在初中语文写作教学中的实践孙巧玲
视觉Transformer还有哪些点可以研究？怎么应用？计算机视觉工坊 3D视觉从入门到精通学习算法开源
0.这篇文章干了啥？今天笔者为大家推荐一篇最新的综述，详细总结了Transformer的网络架构、优化策略、发展方向，还会定期更新Github，研究注意力机制的小伙伴一定不要错过。注意机制有助于人类视觉系统有效地分析和理解复杂场景，它能够聚焦于图像的关键区域，同时忽略无关紧要的部分。受此概念启发，注意机制已经被引入到计算机视觉（CV）中，以动态地为图像中的不同区域分配权重。这使得神经网络能够专注于
使用 PyTorch 和 Pandas 进行 Kaggle 房价预测 Clang's Blog AI pytorch pandas 人工智能
文章目录1、环境设置2、数据下载3、数据预处理4、模型构建5、训练和验证6、训练模型并生成预测结果7、完整代码在本篇博文中，我们将探索如何使用PyTorch和Pandas库，构建一个用于Kaggle房价预测的模型。我们将详细讨论数据加载、预处理、模型构建、训练、验证及最终预测的全过程。1、环境设置我们首先需要导入所需的库，包括用于数据处理的pandas和numpy，以及用于深度学习的torch。i
Python_day54Inception网络及其思考且慢.589 Python_60 python 开发语言
一、inception网络介绍今天我们介绍inception，也就是GoogleNet传统计算机视觉的发展史从上面的链接，可以看到其实inceptionnet是在resnet之前的，那为什么我今天才说呢？因为他要引出我们后面的特征融合和特征并行处理这些思想。Inception网络，也被称为GoogLeNet，是Google团队在2014年提出的经典卷积神经网络架构。它的核心设计理念是“并行的多尺度
AI 绘画 + 编程：10 分钟生成个性化艺术作品大力出奇迹985 人工智能
本文围绕Python+OpenCV实现自动人脸识别门禁系统展开，先概述系统的基本构成与作用，再从系统核心技术、开发实现步骤、功能扩展方向、实际应用场景及优化改进策略五个方面详细阐述，最后总结系统的价值与发展前景，为相关开发和应用提供全面参考。一、系统核心技术解析人脸识别技术是门禁系统的核心，其关键在于对人脸特征的精准提取与匹配。OpenCV作为开源计算机视觉库，提供了丰富的人脸检测算法，如Haar
使用中转API在Python中调用大型语言模型 (LLM) 的实践** qq_37836323 python 语言模型开发语言
**在人工智能技术中，大型语言模型(LLM)已成为自然语言处理(NLP)和生成任务的重要工具。然而，由于网络限制，直接访问OpenAI的API在中国可能面临挑战。因此，本文将介绍如何使用中转API地址http://api.wlai.vip来调用LLM，并提供相关的demo代码。什么是大型语言模型(LLM)？大型语言模型是一种深度学习模型，训练于大量文本数据上，能够生成、总结、翻译和回答问题等。Op
【免费下载】探索PlantVillage-Dataset：深度学习在植物病害检测中的革命性突破
探索PlantVillage-Dataset：深度学习在植物病害检测中的革命性突破在这个数字化时代，人工智能正逐步改变我们的生活，其中深度学习在农业领域的应用尤其引人注目。PlantVillage-Dataset是一个开放源代码的项目，它提供了一个庞大的植物病害识别数据集，旨在帮助开发人员和研究者利用机器学习技术改善农作物健康状况的监测。本文将深入探讨该项目的技术细节、应用价值及其独特之处。项目简
Python爬虫【五十八章】Python数据清洗与分析全攻略：从Pandas到深度学习的异常检测进阶程序员_CLUB Python入门到进阶 python 爬虫 pandas
目录背景与需求分析第一章：结构化数据清洗实战（Pandas核心技法）1.1数据去重策略矩阵1.2智能缺失值处理体系第二章：深度学习异常检测进阶2.1自动编码器异常检测（时序数据）2.2图神经网络异常检测（关系型数据）第三章：综合案例实战案例1：金融交易反欺诈系统案例2：工业传感器异常检测第四章：性能优化与工程实践4.1大数据处理加速技巧4.2模型部署方案第五章：方法论总结与展望5.1方法论框架5.
【AI大模型：前沿】43、Mamba架构深度解析：为什么它是Transformer最强挑战者？无心水架构 transformer Mamba Mamba架构 AI大模型系统开发实战 AI大模型高手开发 AI大模型系统实战
Transformer架构自2017年诞生以来，一直是NLP、计算机视觉等领域的“统治级”模型架构。但随着序列长度需求的增长（如128K长文本处理、基因组学超长序列分析），其自注意力机制的O(n2)O(n^2)O(n2)计算复杂度成为难以逾越的瓶颈。2023年底，由AlbertGu和TriDao等人提出的Mamba架构，通过创新的“选择性状态空间模型（SelectiveSSM）”实现了线性复杂度（
大模型【进阶】（一）MoE（mixture of experts）混合专家结构 ReinaXue 人工智能笔记语言模型神经网络
什么是MoE结构？MoE（MixtureofExperts，专家混合模型）是一种深度学习模型架构，通常用于处理大规模模型和计算资源效率的挑战。在MoE结构中，模型由多个“专家”组成，每个专家处理不同的任务或输入数据的不同部分，而不是让所有专家都参与每次计算。这种方式提高了计算效率，并在某些情况下有助于增强模型的表现。MoE结构的核心思想专家：在MoE模型中，专家通常指的是网络中的子模型，每个专家具
【三维目标检测】Complex-Yolov4详解（二）：模型结构 Coding的叶子 Python三维点云实战宝典 Complex-Yolo Complex-Yolov4 三维目标检测目标检测 python
本文为博主原创文章，未经博主允许不得转载。本文为专栏《python三维点云从基础到深度学习》系列文章，地址为“https://blog.csdn.net/suiyingy/article/details/124017716”。Complex-Yolo网络模型的核心思想是用鸟瞰图BEV替换Yolo网络输入的RGB图像。因此，在完成BEV处理之后，模型的训练和推理过程基本和Yolo完全一致。Yolov
《揭秘AI应用架构师在智能虚拟人设计系统中的创新思维》 SuperAGI架构师的AI实验室人工智能 ai
揭秘AI应用架构师在智能虚拟人设计系统中的创新思维关键词：AI应用架构师、智能虚拟人、系统设计、创新思维、自然语言处理、计算机视觉、实时交互摘要：智能虚拟人已从科幻走进现实，无论是直播间的虚拟主播、手机里的智能助手，还是元宇宙中的数字分身，它们背后都离不开AI应用架构师的“隐形设计”。本文将以“总设计师视角”，用生活化的比喻和实例，拆解AI应用架构师在智能虚拟人系统设计中的创新思维——从“让虚拟人
AI人工智能为空间智能领域带来的科技革新 AI云原生与云计算技术学院 AI云原生与云计算人工智能科技 ai
AI人工智能为空间智能领域带来的科技革新关键词：人工智能、空间智能、计算机视觉、SLAM、空间计算、增强现实、自动驾驶摘要：本文将深入探讨人工智能如何革新空间智能领域。我们将从基本概念出发，逐步分析AI在空间感知、理解和交互方面的突破性进展，包括SLAM技术、3D重建、空间计算等核心应用。通过生动的比喻和实际案例，揭示AI如何赋予机器"空间思维"能力，并展望这一技术融合的未来发展趋势。背景介绍目的
基于深度学习的图像分类：使用ShuffleNet实现高效分类 Blossom.118 机器学习与人工智能深度学习分类人工智能机器学习数据挖掘 python 目标检测
前言图像分类是计算机视觉领域中的一个基础任务，其目标是将输入的图像分配到预定义的类别中。近年来，深度学习技术，尤其是卷积神经网络（CNN），在图像分类任务中取得了显著的进展。ShuffleNet是一种轻量级的深度学习架构，专为移动和嵌入式设备设计，能够在保持较高分类精度的同时，显著减少计算量和模型大小。本文将详细介绍如何使用ShuffleNet实现高效的图像分类，从理论基础到代码实现，带你一步步掌
《零基础入门AI：从图像梯度到凸包特征检测（OpenCV图像特征提取）》竹子_23 OpenCV入门 opencv 人工智能计算机视觉
一、图像梯度处理：理解像素变化的本质1.1图像梯度基础图像梯度是计算机视觉中的核心概念，它描述了图像中像素强度的变化情况：梯度方向：像素值变化最剧烈的方向（垂直于边缘）梯度幅度：像素值变化的强度（值越大表示边缘越明显）物理意义：就像地形图中的等高线，梯度大的地方相当于陡坡，梯度小的地方相当于平地1.2垂直边缘提取垂直边缘是图像中物体左右边界形成的线条：特征：水平方向上像素值发生突变应用场景：文档扫
OpenCV基础02_图像预处理白槿_cha 计算机视觉基础 opencv 人工智能计算机视觉笔记
图像预处理在计算机视觉和图像处理领域，图像预处理是一个重要的步骤，它能够提高后续处理（如特征提取、目标检测等）的准确性和效率。OpenCV提供了许多图像预处理的函数和方法，一些常见的图像预处理操作：图像色彩空间转换图像大小调整图像仿射变换图像翻转图像裁剪图像二值化处理图像去噪边缘检测图像平滑处理图像形态学一、图像翻转cv2.flip是OpenCV库中的一个函数，用于翻转图像。翻转可以是水平翻转、垂
AI人工智能领域深度学习的在线学习方法 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习学习方法 ai
AI人工智能领域深度学习的在线学习方法关键词：深度学习、在线学习、AI教育、实战项目、知识体系摘要：本文为想系统学习深度学习的初学者/转行者量身打造，通过拆解深度学习的核心概念、梳理在线学习的科学路径、提供可落地的实战案例与资源清单，帮你用“游戏通关”的思路高效掌握这门技术。无论你是学生、程序员还是跨行者，都能找到适合自己的学习节奏，避免“看视频就会，动手就废”的陷阱。背景介绍目的和范围深度学习是
AI人工智能深度学习的模型评估与选择 AI大模型应用之禅人工智能深度学习 ai
AI人工智能深度学习的模型评估与选择关键词：AI、人工智能、深度学习、模型评估、模型选择摘要：本文聚焦于AI人工智能深度学习中的模型评估与选择。在深度学习迅猛发展的当下，构建一个有效的模型并非易事，而准确评估和恰当选择模型对于模型性能的发挥和应用效果至关重要。文章将详细介绍模型评估与选择的相关背景知识，深入剖析核心概念与联系，阐述核心算法原理及具体操作步骤，运用数学模型和公式进行详细讲解并举例说明
电表箱识别漏检率高？陌讯算法实测降 90%
在电力巡检领域，电表箱状态识别一直是计算机视觉技术落地的难点。传统人工巡检模式下，一个台区的200个电表箱需2名巡检员耗时1天完成，且受光线、天气影响，误判率常超过15%。而采用普通开源算法部署的自动识别系统，又面临箱体污渍遮挡、表计型号混杂、边缘计算设备算力有限等多重挑战，实际商用时mAP（平均精度）往往跌破70%，难以满足电力行业的可靠性要求技术解析：从传统方法到陌讯创新架构传统电表箱识别多采
以AI人工智能为核心，发展空间智能 AI智能探索者 AI Agent 智能体开发实战人工智能 ai
以AI人工智能为核心，发展空间智能关键词：人工智能、空间智能、智能系统、机器学习、计算机视觉、物联网、自动化技术摘要：本文围绕"以AI人工智能为核心发展空间智能"这一主题，系统解析空间智能的技术架构与实现路径。通过揭示AI与空间智能的核心关联，深入探讨机器学习、计算机视觉、数字孪生等关键技术如何赋能空间数据的感知、处理与决策。结合智能建筑、智慧城市等实际场景，展示从算法原理到工程落地的完整技术链条
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS

（2023|ICML，解耦表示，多条件生成，扩散）Composer：使用合成条件进行创意和可控图像合成

0. 摘要

1. 简介

2. 方法

2.1. 扩散模型

2.2. 分解

2.3. 组合

3. 实验

3.1. 训练细节

3.2. 图像操控

3.3. 传统生成任务的改进

3.4. 组合式图像生成

3.5. 文本到图像生成

4. 相关工作

5. 结论和讨论

附录

A. 架构详细信息

B. 条件模块

S. 总结

S.1 主要贡献

S.2 架构和方法

S.3 应用

你可能感兴趣的:(论文笔记,composer,计算机视觉,深度学习)