好评笔记

SD模型微调之LoRA

大家好，这里是Goodnote（好评笔记），关注公主号Goodnote，专栏文章私信限时Free。本文是 SD 模型微调方法 LoRA 的详细介绍，包括数据集准备，模型微调过程，推理过程，优缺点等。

热门专栏

机器学习

机器学习笔记合集

深度学习

深度学习笔记合集

文章目录

热门专栏

机器学习

深度学习

论文

概念

核心原理

优点

训练过程

预训练模型加载

选择微调的层

LoRA 优化的层

Cross-Attention（跨注意力）层

Self-Attention（自注意力）层

LoRA 如何优化这些层

原始线性层的操作

LoRA 的低秩矩阵分解

优化的关键步骤

推理过程中如何应用优化？

为什么选择优化这些层？

LoRA对部分 Cross-Attention 和 Self-Attention 层进行局部调整，调整层主要是哪些？

低秩分解

训练 LoRA 的低秩矩阵

前向传播（Forward Pass）

反向传播（Backward Pass）

防止过拟合

推理过程

加载微调后的底层模型和 LoRA 权重

输入文本条件

图像生成

控制与调节

推荐阅读

论文

论文地址：LoRA: Low-Rank Adaptation of Large Language Models

概念

LoRA（Low-Rank Adaptation of Large Language Models）是一种用于高效微调大规模预训练模型的技术，特别适用于参数量巨大的模型，如 GPT-3、BERT 或 Stable Diffusion 等。LoRA 提供了一种解决方案，使得在进行模型微调时，只需要微调非常少量的参数，同时保持与全量参数微调相近的性能表现。

核心原理

LoRA（Low-Rank Adaptation of Large Language Models） 的核心原理是通过低秩分解来减少大规模模型微调时需要更新的参数量，以此实现更高效的模型微调。它特别适用于像 GPT-3、BERT 或 Stable Diffusion 这样的预训练大模型，在微调这些模型时，LoRA 通过引入两个低秩矩阵来替代直接更新整个权重矩阵，从而显著降低了计算成本和存储需求。

核心思想：假设预训练模型中的权重矩阵 W 很大。LoRA 的基本思想是将它的更新部分 ΔW 分解为两个秩更小的矩阵 A 和 B 的乘积，从而减少需要更新的参数量，并且仅仅更新这两个矩阵。而不是更新整个 W 矩阵，保持预训练模型的原始性能。

权重矩阵分解的核心公式：

LoRA对权重矩阵 $W$ 进行如下处理：
$W_0 + \Delta W$

其中：

$W_0$ 是预训练模型中的原始权重矩阵，不更新。
$\Delta W$ 是LoRA引入的可训练部分。为了减少训练参数，LoRA将 $\Delta W$ 表示为两个低秩矩阵的乘积： $\Delta W = AB$ 。
$A$ 和 $B$ 是两个低秩矩阵，其中：
- $\in \mathbb{R}^{d \times r}$ （小尺寸矩阵，rank $r$ 远小于 $d$ ）。
- $\in \mathbb{R}^{r \times k}$ （同样是小尺寸矩阵）。

在LoRA中，只训练矩阵 $A$ 和 $B$ ，而不是训练整个权重矩阵 $W$ ，从而减少了需要更新的参数量。

通常来说，对于矩阵A，我们使用 随机高斯分布 初始化，并对矩阵B使用全0 初始化，使得在训练初始状态下这两个矩阵相乘的结果为0。这样能够保证在训练初始阶段时，SD模型的权重完全生效。

小型任务：一般 r 取 1 到 4。

中型任务：通常 r 取 4 到 8。

复杂任务：一般 r 取 8 到 16。

结论来源：深入浅出完整解析LoRA（Low-Rank Adaptation）模型核心基础知识

优点

大幅减少参数更新量：通过对权重矩阵进行低秩分解，LoRA 只需要更新非常少的参数，而不是整个模型的参数。这大大降低了存储需求和计算成本。
保持模型的原始性能：LoRA 冻结SD模型的权重，因此微调后的模型依然可以利用预训练模型的知识。
模块化更新和可插拔设计：LoRA 的权重调整是通过 A 和 B 进行的，在推理时也可以轻松应用，不需要重新加载整个模型。LoRA 训练出的 A 和 B 矩阵是可以独立保存的。在推理时，你可以在不同任务之间快速切换，而不需要重新训练模型。

训练过程

LoRA 微调的训练过程可分为以下几个步骤：

预训练模型加载

首先，加载一个预训练的 Stable Diffusion 模型。这个模型已经在大规模的文本图像数据集上进行了训练，具备强大的生成能力。LoRA 的目标是在该预训练模型上微调，只需调整极少的参数。

选择微调的层

在 Stable Diffusion 模型中，LoRA 通常作用于模型中的线性层（主要在注意力模块的 Q、K、V 的三个权重矩阵W）。具体来说，LoRA 会对 U-Net 中的 cross-attention 机制、自注意力机制的线性层等进行调整。

LoRA 通过对这些线性层中的权重矩阵进行低秩分解（主要在注意力模块的 Q、K、V 权重），并引入两个低秩矩阵 A 和 B，通过这些矩阵来调整权重变化。

详细介绍如下：

LoRA 主要作用于 U-Net 网络中的 注意力机制相关的线性层，特别是用于跨模态交互的 Cross-Attention（跨注意力）层 以及 Self-Attention（自注意力）层。

LoRA 优化的层

在 Stable Diffusion 的 U-Net 中，主要有两种注意力机制：自注意力机制（Self-Attention） 和 跨注意力机制（Cross-Attention）。LoRA 主要对这些注意力层中的 线性层 进行优化，特别是以下几个部分：

Cross-Attention（跨注意力）层

Cross-Attention 是 U-Net 中的核心机制，它负责将图像的潜在特征（Latent Feature）与文本嵌入（Text Embedding）进行结合。通过跨注意力机制，模型可以从文本提示中获取信息，调整图像生成的内容。
在 Cross-Attention 中，LoRA 主要针对用于生成 Query (Q)、Key (K) 和 Value (V) 的线性变换层【 $W_Q \cdot X, \quad K = W_K \cdot X, \quad V = W_V \cdot X$ 】进行优化。这些层分别处理输入特征和文本嵌入，并计算注意力权重。

Self-Attention（自注意力）层

Self-Attention 是 U-Net 内部的图像特征交互机制，负责在图像的不同区域之间进行特征相互作用，从而捕捉到图像的全局依赖关系。
在 Self-Attention 中，LoRA 也对生成 Query (Q)、Key (K) 和 Value (V) 的线性层进行优化。

LoRA 如何优化这些层

LoRA 通过将注意力机制中的 线性层（例如，用于生成 Q、K、V 的线性变换层）进行低秩分解，从而减少参数更新量。具体的优化方式如下：

原始线性层的操作

在注意力机制中，通常会对输入特征进行如下操作：

输入特征 $X$ 会通过线性层进行映射，生成 Query (Q)、Key (K) 和 Value (V)，具体公式为：
$W_Q X, \quad K = W_K X, \quad V = W_V X$
- 其中， $W_Q$ 、 $W_K$ 、 $W_V$ 是用于生成 $Q$ 、 $K$ 、 $V$ 的权重矩阵。在标准微调过程中，这些权重矩阵会被更新。

LoRA 的低秩矩阵分解

与原始公式直接更新整个 $W_Q$ 、 $W_K$ 、 $W_V$ 矩阵相比，在 LoRA 中通过使用两个更小的矩阵 A 和 B 来表示这些矩阵的变化：

引入 低秩分解 对权重矩阵进行调整： $W_Q$ 、 $W_K$ 、 $W_V$ 被表示为预训练权重加上一个低秩矩阵的调整：

$W_Q = W_Q^0 + \Delta W_Q, \quad \Delta W_Q = A_Q B_Q$

类似的公式用于 $W_K$ 和 $W_V$ 。
- $A_Q$ 和 $B_Q$ 是两个低秩矩阵，秩（rank） $r$ 远小于输入维度和输出维度。这样，LoRA只需要训练 $A_Q$ 和 $B_Q$ ，从而减少了需要训练的参数量。
- 在推理阶段，更新后的权重 $W_Q$ 就是原始权重 $W_Q^0$ 加上 $A_Q B_Q$ 。

优化的关键步骤

保持原始权重不变：在LoRA微调中，原始的权重矩阵 $W_Q^0$ 、 $W_K^0$ 、 $W_V^0$ 保持不变，这意味着预训练模型的知识不会被破坏。
只训练低秩矩阵 $A$ 和 $B$ ：通过训练 $A_Q$ 和 $B_Q$ （以及对应的 $A_K$ 、 $A_V$ 和 $B_K$ 、 $B_V$ ），LoRA微调可以适应新任务的需求，同时大幅减少了参数更新量。

推理过程中如何应用优化？

在推理阶段，LoRA 的优化部分通过如下方式应用于模型：

应用权重更新：在推理过程中，LoRA 使用微调后的低秩矩阵 A 和 B，并将它们加到原始的权重矩阵中。例如，计算 Q 时：

$Q = (W_Q^0 + A_Q B_Q)X$
这个更新后的权重矩阵确保模型能够在保持原始生成能力的同时，生成包含定制内容的图像。

为什么选择优化这些层？

LoRA 选择优化 Attention 层中的线性层 有以下原因：

Attention 层是核心：在 Stable Diffusion 的 U-Net 中，Attention 层（特别是 Cross-Attention 层）是将图像生成与文本提示结合的关键部分。对这些层进行优化，可以直接影响模型如何将文本信息传递给图像生成过程。
低秩分解的有效性：对于大型模型中的全连接层，低秩分解可以在不显著影响模型性能的情况下，显著减少参数更新量。Attention 层中的权重矩阵往往是高维的，因此通过 LoRA 对它们进行低秩分解能大幅降低训练成本。
减少计算开销：注意力机制中的线性层通常参数量大且计算密集，通过 LoRA 的低秩分解，可以在降低计算复杂度的同时保留模型的生成能力。

LoRA对部分 Cross-Attention 和 Self-Attention 层进行局部调整，调整层主要是哪些？

U-Net 中确实包含多个分辨率下的 Self-Attention 和 Cross-Attention 层，但 LoRA 的微调是有选择性的，并不会对每一个 Attention 层进行微调。LoRA 的设计初衷是通过低秩矩阵分解的方式只微调关键的 Attention 层。

LoRA 通常会优先选择在以下部分进行微调，而不会对整个 U-Net 中的所有层进行调整：

1.瓶颈部分的 Attention 层

理由：瓶颈部分位于 编码器和解码器之间，是整个 U-Net 中分辨率最低的层级。这个部分的特征代表了全局的高层次信息和抽象概念。瓶颈部分的 Cross-Attention 层进行微调，因为这一部分的 Attention 负责将文本嵌入（来自 CLIP）与图像的潜在特征结合。由于这一部分影响整个生成过程的全局结构和语义，微调这里的 Cross-Attention 层可以最大化对文本提示的响应。

2.解码器中的高分辨率层 Attention

理由：解码器的高分辨率层在解码器靠近输出的层中。这些层逐步将潜在特征映射回高分辨率图像，负责生成最终图像的细节，微调这些层的 Self-Attention 和 Cross-Attention 机制有助于确保图像的细节和纹理质量。LoRA 选择性地微调这些层以保持生成细节的精准度。

3.部分中间层

理由：中间层出现在编码器部分和解码器部分的中间位置，即编码器将分辨率逐步降低时或解码器逐步上采样时的过渡层。在某些任务中，特别是需要全局一致性时，LoRA 可能会对部分中等分辨率层进行调整。这通常只针对某些关键的中间层，而不会全面覆盖所有中间层的 Attention 层。

其他的层不会进行改变。 DreamBooth会更改全部的Attention层。

低秩分解

对于每个需要微调的层，LoRA 将该层的权重矩阵 W 进行低秩分解：

$W_0 + \Delta W$

其中：

$W_0$ 是预训练模型的权重矩阵，保持不变。
$\Delta W = AB$ 是通过LoRA进行调整的部分，仅训练低秩矩阵 $A$ 和 $B$ 。

训练 LoRA 的低秩矩阵

在 LoRA 的训练过程中，我们仅训练 A 和 B 这两个低秩矩阵，而保持模型中原始的权重 $W_0$ 不变。这种方法显著减少了需要更新的参数量，降低了训练开销。

具体流程：

图像和文本输入：使用包含图片和文本描述的数据对模型进行训练，类似于 Stable Diffusion 的预训练任务。
损失函数：LoRA 的损失函数与原始 Stable Diffusion 的损失函数类似，主要通过预测噪声残差来进行训练。损失函数通常是均方误差（MSE），公式如下：

$L_{\text{MSE}} = \mathbb{E}_{x_0, \epsilon, t} [ \| \epsilon - \epsilon_{\theta}(x_t, t, c) \|^2 ]$
- 其中 $x_0$ 是原始图像， $x_t$ 是经过扩散步骤后的加噪图像， $c$ 是文本条件， $\epsilon$ 是噪声。
- 通过损失函数来最小化模型预测的噪声残差与真实噪声之间的差异。
只更新低秩矩阵：在反向传播时，LoRA 只更新 A 和 B，而保持预训练模型的其余部分不变。通过这样的方法，模型能够在少量参数更新的情况下学会新的任务。

更详细的过程如下：

前向传播（Forward Pass）

输入数据准备：

输入包括图像和文本描述，这些输入会通过文本编码器（如 CLIP）和 Stable Diffusion 的 U-Net 进行特征提取。

权重替换：

在LoRA中，原始预训练的权重矩阵 $W_0$ 不会直接更新，而是扩展为：
$W_0 + A \cdot B$
- 其中， $W_0$ 是原始权重矩阵，保持不变， $A$ 和 $B$ 是引入的低秩矩阵，分别为 $(d, r)$ 和 $(r, k)$ 维度， $r$ 是低秩维度。
这样，U - Net中的线性层权重（特别是Cross - Attention和Self - Attention中的Q、K、V权重）会通过 $W$ 替代原始的 $W_0$ ，在前向传播中完成线性变换。

生成 Q、K 和 V 矩阵：

对于输入的图像特征和文本嵌入，模型通过线性层生成 Q、K 和 V 矩阵：

$W_Q \cdot \text{input}$
$W_K \cdot \text{input}$
$W_V \cdot \text{input}$

这里 $W_Q$ 、 $W_K$ 和 $W_V$ 表示 Attention 层的线性层权重。在 LoRA 微调时，这些权重扩展为：

$W_Q = W_{Q0} + A_Q \cdot B_Q$
$W_K = W_{K0} + A_K \cdot B_K$
$W_V = W_{V0} + A_V \cdot B_V$

在前向传播时，使用这些新的 Q、K、V 权重来计算 Attention 输出。

计算注意力分数：

得到 Q 和 K 矩阵后，通过点积计算 Attention 分数，并使用 Softmax 进行归一化，以确定图像特征和文本特征的相关性：
$\text{Attention Scores} = \text{Softmax} \left( \frac{Q \cdot K^T}{\sqrt{d_k}} \right)$
- 其中， $d_k$ 是 $Q$ 、 $K$ 的维度，用于缩放以稳定梯度。这一步将重要特征赋予更高权重。

应用注意力分数到 Value 矩阵：

将注意力分数应用到 $V$ 矩阵上，生成注意力聚合后的输出特征：

$\text{Attention Output} = \text{Attention Scores} \cdot V$

这一步的输出包含了从输入特征中提取的重要信息，带有新任务的特征细节。

注意力输出用于噪声预测【同DDPM扩散过程】

DDPM原理参考：Stable Diffusion 笔记合集中的《Diffusion Model原理》。

损失计算：

根据前向传播的输出，通过损失函数（通常为均方误差 MSE）计算预测噪声残差与目标的差异：

$L_{\text{MSE}} = \mathbb{E}_{x_0, \epsilon, t} [ \| \epsilon - \epsilon_{\theta}(x_t, t, c) \|^2 ]$

其中 $x_0$ 是原始图像， $x_t$ 是经过扩散步骤后的加噪图像， $c$ 是文本条件， $\epsilon$ 是噪声。
通过损失函数来最小化模型预测的噪声残差与真实噪声之间的差异。

反向传播（Backward Pass）

计算损失的梯度：

根据损失函数 L，计算损失相对于 A 和 B 的梯度：
$\frac{\partial L}{\partial A} \quad 和 \quad \frac{\partial L}{\partial B}$

锁定原始权重矩阵 $W_0$ ：

在反向传播过程中，LoRA 只更新 $A$ 和 $B$ ，而保持原始的权重矩阵 $W_0$ 不变。这保证了预训练的知识不会被破坏，同时通过 A 和 B 的更新来适应新任务特征。

更新低秩矩阵 A 和 B：

根据梯度，用优化算法（如 Adam）对 A 和 B 的参数进行更新：

$\leftarrow A - \frac{\partial L}{\partial A} \eta$
$\leftarrow B - \frac{\partial L}{\partial B} \eta$
- 这里 $\eta$ 是学习率，更新后的 $A$ 和 $B$ 让模型在不改变预训练权重的前提下适应新任务的特征。

防止过拟合

为了避免微调时模型过拟合到新数据集，LoRA 引入了正则化技术，并且通常通过选择较小的秩（rank）来限制低秩矩阵的参数量。较小的秩 r 能够确保模型在学习新任务时不会丢失原有的生成能力，同时避免过拟合。

小型任务（简单图像生成、基本文本任务）：一般 r 取 1 到 4。对于简单任务，这样的秩通常能够捕捉到足够的特征变化，并且显著减少了微调参数。

中型任务（如在特定风格或特定场景下生成图像）：通常 r 取 4 到 8。这种秩设置在保持微调效率的同时，能够适应稍复杂的任务。

复杂任务（高分辨率图像生成、大规模定制化）：一般 r 取 8 到 16。对于非常复杂的生成任务，较高的秩可以捕捉到更细致的特征，但会增加参数量和计算开销。

推理过程

推理过程与标准的 Stable Diffusion 推理过程类似，但会在原始模型的基础上加上 LoRA 的调整部分。

推理的流程如下：

加载微调后的底层模型和 LoRA 权重

在推理阶段，我们需要加载预训练的 Stable Diffusion 模型 和 微调得到的 LoRA 权重（即 A 和 B 的值）。这些权重通常是很小的存储文件，容易加载和应用。
模型的推理过程会利用原始权重 W0 和微调得到的 ΔW=AB。

输入文本条件

用户可以输入一个文本描述，作为 Stable Diffusion 模型生成图像的提示。这个文本描述会通过 CLIP 模型编码为 文本嵌入（Text Embedding），并作为条件输入到生成过程。

图像生成

在推理时，LoRA 通过原始权重 W0 加上训练时得到的 ΔW 生成最终的图像：
$y = (W_0 + AB)x$
- 其中， $x$ 是输入的潜在向量或图像特征， $y$ 是经过 LoRA 微调后的生成结果。
模型会通过一系列反向扩散步骤，逐步去除噪声，生成符合输入文本描述的图像。

控制与调节

通过调整输入的文本提示，用户可以灵活控制生成图像的风格、内容和其他细节。
LoRA 提供了模块化设计，可以轻松替换不同的 LoRA 微调权重，以适应不同的任务和数据集。例如，可以在同一个模型上应用多个不同的 LoRA 微调权重，以生成不同风格或内容的图像。

推荐阅读

使用 LoRA 进行 Stable Diffusion 的高效参数微调

全世界 LoRA 训练脚本，联合起来!

LoRA使用脚本训练Unet和text encoder全过程

使用set_adapters加载LoRAS以进行推断，自定义适配器强度

负载适配器，加载Dreambooth、Textual inversion、LoRA、IP-Adapter：

https://huggingface.co/docs/diffusers/using-diffusers/loading_adapters#LoRA
https://huggingface.co/docs/diffusers/using-diffusers/merge_loras

说明：

Lora可以于其他的手段一起使用，例如和 textual inversion和dreambooth等。
Lora在更改模型时候主要改unet，也可以对text encoder进行微调
扩散社区中的LoRA检查点几乎总是通过DreamBooth获得。

力扣面试题07 - 旋转矩阵茶猫_ leetcode 矩阵算法 c语言
题目：给你一幅由N×N矩阵表示的图像，其中每个像素的大小为4字节。请你设计一种算法，将图像旋转90度。不占用额外内存空间能否做到？示例1:给定matrix=[[1,2,3],[4,5,6],[7,8,9]],原地旋转输入矩阵，使其变为:[[7,4,1],[8,5,2],[9,6,3]]示例2:给定matrix=[[5,1,9,11],[2,4,8,10],[13,3,6,7],[15,14,12,
最新阿里四面面试真题46道：面试技巧+核心问题+面试心得风平浪静如码
前言做技术的有一种资历，叫做通过了阿里的面试。这些阿里Java相关问题，都是之前通过不断优秀人才的铺垫总结的，先自己弄懂了再去阿里面试，不然就是去丢脸，被虐。希望对大家帮助，祝面试成功，有个更好的职业规划。一，阿里常见技术面1、微信红包怎么实现。2、海量数据分析。3、测试职位问的线程安全和非线程安全。4、HTTP2.0、thrift。5、面试电话沟通可能先让自我介绍。6、分布式事务一致性。7、ni
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
分布式链路追踪系统架构设计：从理论到企业级实践 ma451152002 java 分布式系统架构
分布式链路追踪系统架构设计：从理论到企业级实践本文深入探讨分布式链路追踪系统的架构设计原理、关键技术实现和企业级应用实践，为P7架构师提供完整的技术方案参考。目录引言：分布式链路追踪的重要性核心概念与技术原理系统架构设计数据模型与协议标准核心组件架构设计性能优化与扩展性设计企业级实施策略技术选型与对比分析监控与运维体系未来发展趋势P7架构师面试要点引言：分布式链路追踪的重要性微服务架构下的挑战在现
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
面试必考题：Android Binder 机制详解大模型大数据攻城狮 android binder 面试 react native kotlin dalvik retrofit
目录第一章：Binder的基本概念什么是Binder？多角度解读Binder第二章：Binder的工作机制Binder的整体流程服务注册：从零到有的第一步服务查询：找到目标的“地图”服务调用：请求与响应的旅程Binder驱动的幕后功劳为什么Binder这么快？第三章：Binder在系统架构中的角色Activity：界面背后的通信枢纽Binder的角色实例分析Service：后台任务的跨进程支柱Bi
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元 Liudef06小白特殊专栏 AIGC 人工智能 AI作画人工智能 AIGC
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元随着多模态AI技术的爆发式发展，StableDiffusionXL（SDXL）等文生图模型正在彻底重塑创意产业工作流。本文将深入解析如何在魔搭平台高效训练SDXL模型，并探讨AI绘画技术对设计行业的革命性影响。一、SDXL模型架构解析1.1双文本编码器设计SDXL采用双文本编码器架构，显著提升提示词理解能力：#SDXL文本编码器结构示意c
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
19.0-《超越感觉》-说服他人 SAM52
Becausethoughtfuljudgmentsdeservetobeshared,andthewaytheyarepresentedcanstronglyinfluencethewayothersreacttothem.因为经过深思熟虑的判断值得分享，而这些判断的呈现方式会强烈影响其他人对它们的反应。Bylearningtheprinciplesofpersuasionandapplying
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
前端面试每日 3+1 —— 第39天浪子神剑
今天的面试题(2019.05.25)——第39天[html]title与h1、b与strong、i与em的区别分别是什么？[css]写出你知道的CSS水平和垂直居中的方法[js]说说你对模块化的理解[软技能]公钥加密和私钥加密是什么？《论语》，曾子曰：“吾日三省吾身”（我每天多次反省自己）。前端面试每日3+1题，以面试题来驱动学习，每天进步一点！让努力成为一种习惯，让奋斗成为一种享受！欢迎在Iss
一次创伤后应激障碍（ PTSD）会产生终身的影响作家土著
创伤后应激障碍（PTSD）这个概念听起来好像离我们比较远，甚至不了解这个概念的人，还会主观的认为是矫情。然而，这是一个严肃的科学问题，一旦因为重大刺激而产生PTSD的后果会比较严重，甚至是终生的影响。《天生有罪：特雷弗·诺亚的变色人生》这本，美国当红脱口秀《小崔每日秀》主持人特雷弗·诺亚的回忆录中就讲到：他永远只会选择带担保的新车的原因就是——PTSD。他人生中的倒霉事都与二手车辆车不无关系。小时
GDP经济社会人文民生栅格数据下载网站汇总疯狂学习GIS
本文为“GIS数据获取整理”专栏（https://blog.csdn.net/zhebushibiaoshifu/category_10857546.html）中第八篇独立博客，因此本文全部标题均由“8”开头。本文对目前主要的GDP、社会与经济数据获取网站加以整理与介绍，若需其它GIS领域数据（如遥感影像数据、气象数据、土地土壤数据、农业数据等），大家可以点击上方专栏查看，也可以看这一篇汇总文
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
August 22，Thursday & Jeudi 转院康复第三天 emmanuelleZHAO
今天是转院康复第三天，已经三天没有做肢体康复了。昨天下午是医生忘记了，今天是我哥忘记了。陪床这十几天，感觉最累的是家人对治病的意见不一致。比如今天，我哥就要出院，才来三天就要出院，开玩笑吧……妈妈现在失语比较厉害，所以练习吞咽的同时还需要练习语言功能。这是一个慢慢恢复的过程，而且即使恢复了，也不会恢复到生病之前到状态。需要有这个心里准备…我这里比较麻烦的事.人在北京，。9月中旬前还可以，9月中旬后
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
【MySQL】MySQL数据库如何改名武昌库里写JAVA 面试题汇总与解析 spring boot vue.js sql java 学习
MySQL建库授权语句https://www.jianshu.com/p/2237a9649ceeMySQL数据库改名的三种方法https://www.cnblogs.com/gomysql/p/3584881.htmlMySQL安全修改数据库名几种方法https://blog.csdn.net/haiross/article/details/51282417MySQL重命名数据库https://
安装器处点击“打开” 钦_79f7
问题描述：安装系统SD卡里面的apk或者原有的程序更新版本或者通过ADB安装apk的时候，会遇到升级安装成功之后的一个选择——“打开”和“完成”，点击完成没有问题，但是，如果点击了"打开"，然后按Home键，从应用程序列表里面选择应用程序图标进入或者点击桌面启动图标，这个时候就会重新启动了一个应用程序，之后的操作就会出现混乱等问题。原因分析：参考底部相关资料链接解决方案：在launcherActi
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
【经典面试题】【JVM与性能调优】垃圾回收算法（标记-清除算法/复制算法/标记-整理算法/CMS/G1/ZGC）本本本添哥归档 -Inbox1 001 -基础开发能力面试题目汇总 jvm 算法
JVM自动管理内存，当对象不再被引用时，垃圾回收器（GarbageCollector）会自动释放这些对象占用的内存。标记-清除算法（Mark-Sweep）：标记垃圾再清除，会产生碎片。复制算法（Copying）：将存活对象复制到新区域，适合新生代，无碎片但浪费空间。标记-整理算法（Mark-Compact）：标记后将存活对象移到一端，清除另一端，适合老年代。分代收集算法（GenerationalC
LeetCode[Math] - #66 Plus One Cwind java LeetCode 题解 Algorithm Math
原题链接：#66 Plus One 要求：给定一个用数字数组表示的非负整数，如num1 = {1, 2, 3, 9}, num2 = {9, 9}等，给这个数加上1。注意： 1. 数字的较高位存在数组的头上，即num1表示数字1239 2. 每一位（数组中的每个元素）的取值范围为0~9 难度：简单分析：题目比较简单，只须从数组
JQuery中$.ajax()方法参数详解 AILIKES JavaScript jsonp jquery Ajax json
url: 要求为String类型的参数，（默认为当前页地址）发送请求的地址。 type: 要求为String类型的参数，请求方式（post或get）默认为get。注意其他http请求方法，例如put和 delete也可以使用，但仅部分浏览器支持。 timeout: 要求为Number类型的参数，设置请求超时时间（毫秒）。此设置将覆盖$.ajaxSetup()方法的全局
JConsole & JVisualVM远程监视Webphere服务器JVM Kai_Ge JVisualVM JConsole Webphere
JConsole是JDK里自带的一个工具，可以监测Java程序运行时所有对象的申请、释放等动作，将内存管理的所有信息进行统计、分析、可视化。我们可以根据这些信息判断程序是否有内存泄漏问题。　　使用JConsole工具来分析WAS的JVM问题，需要进行相关的配置。　　首先我们看WAS服务器端的配置. 　　1、登录was控制台https://10.4.119.18
自定义annotation 120153216 annotation
Java annotation 自定义注释@interface的用法一、什么是注释说起注释，得先提一提什么是元数据(metadata)。所谓元数据就是数据的数据。也就是说，元数据是描述数据的。就象数据表中的字段一样，每个字段描述了这个字段下的数据的含义。而J2SE5.0中提供的注释就是java源代码的元数据，也就是说注释是描述java源
CentOS 5/6.X 使用 EPEL YUM源 2002wmj centos
CentOS 6.X 安装使用EPEL YUM源1. 查看操作系统版本[root@node1 ~]# uname -a Linux node1.test.com 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux [root@node1 ~]#
在SQLSERVER中查找缺失和无用的索引SQL 357029540 SQL Server
--缺失的索引 SELECT avg_total_user_cost * avg_user_impact * ( user_scans + user_seeks ) AS PossibleImprovement , last_user_seek ,
Spring3 MVC 笔记（二） —json+rest优化 7454103 Spring3 MVC
接上次的 spring mvc 注解的一些详细信息！其实也是一些个人的学习笔记呵呵！
替换“\”的时候报错Unexpected internal error near index 1 \ ^ adminjun java “\替换”
发现还是有些东西没有刻子脑子里,,过段时间就没什么概念了,所以贴出来...以免再忘... 在拆分字符串时遇到通过 \ 来拆分，可是用所以想通过转义 \\ 来拆分的时候会报异常 public class Main { /*
POJ 1035 Spell checker(哈希表) aijuans 暴力求解--哈希表
/* 题意：输入字典，然后输入单词，判断字典中是否出现过该单词，或者是否进行删除、添加、替换操作，如果是，则输出对应的字典中的单词要求按照输入时候的排名输出题解：建立两个哈希表。一个存储字典和输入字典中单词的排名，一个进行最后输出的判重 */ #include <iostream> //#define using namespace std; const int HASH =
通过原型实现javascript Array的去重、最大值和最小值 ayaoxinchao JavaScript array prototype
用原型函数（prototype）可以定义一些很方便的自定义函数，实现各种自定义功能。本次主要是实现了Array的去重、获取最大值和最小值。实现代码如下： <script type="text/javascript"> Array.prototype.unique = function() { var a = {}; var le
UIWebView实现https双向认证请求 bewithme UIWebView https Objective-C
什么是HTTPS双向认证我已在先前的博文 ASIHTTPRequest实现https双向认证请求中有讲述，不理解的读者可以先复习一下。本文是用UIWebView来实现对需要客户端证书验证的服务请求，网上有些文章中有涉及到此内容，但都只言片语，没有讲完全，更没有完整的代码，让人困扰不已。但是此知
NoSQL数据库之Redis数据库管理(Redis高级应用之事务处理、持久化操作、pub_sub、虚拟内存) bijian1013 redis 数据库 NoSQL
3.事务处理 Redis对事务的支持目前不比较简单。Redis只能保证一个client发起的事务中的命令可以连续的执行，而中间不会插入其他client的命令。当一个client在一个连接中发出multi命令时，这个连接会进入一个事务上下文，该连接后续的命令不会立即执行，而是先放到一个队列中，当执行exec命令时，redis会顺序的执行队列中
各数据库分页sql备忘 bingyingao oracle sql 分页
ORACLE 下面这个效率很低 SELECT * FROM ( SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_FS_RETURN order by id desc) A ) WHERE RN <20; 下面这个效率很高 SELECT A.*, ROWNUM RN FROM (SELECT * FROM IPAY_RCD_
【Scala七】Scala核心一：函数 bit1129 scala
1. 如果函数体只有一行代码，则可以不用写{},比如 def print(x: Int) = println(x) 一行上的多条语句用分号隔开，则只有第一句属于方法体，例如 def printWithValue(x: Int) : String= println(x); "ABC" 上面的代码报错，因为，printWithValue的方法
了解GHC的factorial编译过程 bookjovi haskell
GHC相对其他主流语言的编译器或解释器还是比较复杂的，一部分原因是haskell本身的设计就不易于实现compiler，如lazy特性，static typed，类型推导等。关于GHC的内部实现有篇文章说的挺好，这里，文中在RTS一节中详细说了haskell的concurrent实现，里面提到了green thread，如果熟悉Go语言的话就会发现，ghc的concurrent实现和Go有点类
Java-Collections Framework学习与总结-LinkedHashMap BrokenDreams LinkedHashMap
前面总结了java.util.HashMap，了解了其内部由散列表实现，每个桶内是一个单向链表。那有没有双向链表的实现呢？双向链表的实现会具备什么特性呢？来看一下HashMap的一个子类——java.util.LinkedHashMap。
读《研磨设计模式》-代码笔记-抽象工厂模式-Abstract Factory bylijinnan abstract
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * Abstract Factory Pattern * 抽象工厂模式的目的是： * 通过在抽象工厂里面定义一组产品接口，方便地切换“产品簇” * 这些接口是相关或者相依赖的
压暗面部高光 cherishLC PS
方法一、压暗高光&重新着色当皮肤很油又使用闪光灯时，很容易在面部形成高光区域。下面讲一下我今天处理高光区域的心得：皮肤可以分为纹理和色彩两个属性。其中纹理主要由亮度通道（Lab模式的L通道）决定，色彩则由a、b通道确定。处理思路为在保持高光区域纹理的情况下，对高光区域着色。具体步骤为：降低高光区域的整体的亮度，再进行着色。如果想简化步骤，可以只进行着色（参看下面的步骤1
Java VisualVM监控远程JVM crabdave visualvm
Java VisualVM监控远程JVM JDK1.6开始自带的VisualVM就是不错的监控工具. 这个工具就在JAVA_HOME\bin\目录下的jvisualvm.exe, 双击这个文件就能看到界面通过JMX连接远程机器, 需要经过下面的配置: 1. 修改远程机器JDK配置文件 (我这里远程机器是linux).
Saiku去掉登录模块 daizj saiku 登录 olap BI
1、修改applicationContext-saiku-webapp.xml <security:intercept-url pattern="/rest/**" access="IS_AUTHENTICATED_ANONYMOUSLY" /> <security:intercept-url pattern=&qu
浅析 Flex中的Focus dsjt html Flex Flash
关键字：focus、 setFocus、 IFocusManager、KeyboardEvent 焦点、设置焦点、获得焦点、键盘事件一、无焦点的困扰——组件监听不到键盘事件原因：只有获得焦点的组件（确切说是InteractiveObject）才能监听到键盘事件的目标阶段；键盘事件（flash.events.KeyboardEvent）参与冒泡阶段，所以焦点组件的父项（以及它爸
Yii全局函数使用 dcj3sjt126com yii
由于YII致力于完美的整合第三方库，它并没有定义任何全局函数。yii中的每一个应用都需要全类别和对象范围。例如，Yii::app()->user;Yii::app()->params['name'];等等。我们可以自行设定全局函数，使得代码看起来更加简洁易用。(原文地址) 我们可以保存在globals.php在protected目录下。然后，在入口脚本index.php的，我们包括在
设计模式之单例模式二（解决无序写入的问题） come_for_dream 单例模式 volatile 乱序执行双重检验锁
在上篇文章中我们使用了双重检验锁的方式避免懒汉式单例模式下由于多线程造成的实例被多次创建的问题，但是因为由于JVM为了使得处理器内部的运算单元能充分利用，处理器可能会对输入代码进行乱序执行（Out Of Order Execute）优化，处理器会在计算之后将乱序执行的结果进行重组，保证该
程序员从初级到高级的蜕变 gcq511120594 框架工作 PHP android html5
软件开发是一个奇怪的行业，市场远远供不应求。这是一个已经存在多年的问题，而且随着时间的流逝，愈演愈烈。我们严重缺乏能够满足需求的人才。这个行业相当年轻。大多数软件项目是失败的。几乎所有的项目都会超出预算。我们解决问题的最佳指导方针可以归结为——“用一些通用方法去解决问题，当然这些方法常常不管用，于是，唯一能做的就是不断地尝试，逐个看看是否奏效”。现在我们把淫浸代码时间超过3年的开发人员称为
Reverse Linked List hcx2013 list
Reverse a singly linked list. /** * Definition for singly-linked list. * public class ListNode { * int val; * ListNode next; * ListNode(int x) { val = x; } * } */ p
Spring4.1新特性——数据库集成测试 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
C# Ajax上传图片同时生成微缩图(附Demo) liyonghui160com
1.Ajax无刷新上传图片,详情请阅我的这篇文章。（jquery + c# ashx） 2.C#位图处理 System.Drawing。 3.最新demo支持IE7,IE8,Fir
Java list三种遍历方法性能比较 pda158 java
从c/c++语言转向java开发，学习java语言list遍历的三种方法，顺便测试各种遍历方法的性能，测试方法为在ArrayList中插入1千万条记录，然后遍历ArrayList，发现了一个奇怪的现象，测试代码例如以下： package com.hisense.tiger.list; import java.util.ArrayList; import java.util.Iterator;
300个涵盖IT各方面的免费资源（上）——商业与市场篇 shoothao seo 商业与市场 IT资源免费资源
A.网站模板+logo+服务器主机+发票生成 HTML5 UP:响应式的HTML5和CSS3网站模板。 Bootswatch:免费的Bootstrap主题。 Templated:收集了845个免费的CSS和HTML5网站模板。 Wordpress.org|Wordpress.com:可免费创建你的新网站。 Strikingly:关注领域中免费无限的移动优
localStorage、sessionStorage uule localStorage
W3School 例子 HTML5 提供了两种在客户端存储数据的新方法： localStorage - 没有时间限制的数据存储 sessionStorage - 针对一个 session 的数据存储之前，这些都是由 cookie 完成的。但是 cookie 不适合大量数据的存储，因为它们由每个对服务器的请求来传递，这使得 cookie 速度很慢而且效率也不