s1ckrain

【论文阅读】Packing Input Frame Context in Next-Frame Prediction Models for Video Generation

Packing Input Frame Context in Next-Frame Prediction Models for Video Generation

原文摘要
- 提出 FramePack 架构
  - 一种新的视频生成模型结构。
  - 基于“下一帧预测”的思路进行视频生成。
- FramePack核心思想
  - 压缩输入帧，固定上下文长度
    - 将输入的多个帧压缩成固定长度的上下文。
    - 无论视频有多少帧，Transformer 的输入长度都不变。
    - 解决了随着视频长度增加而显存爆炸的问题。
  - 提出 Anti-Drifting 反漂移采样策略
    - 先生成视频的开头和结尾，再生成中间帧。
    - 生成顺序是“时间反向”的。
    - 目的：防止误差在逐帧生成中逐步累积。
  - 支持大 Batch 训练
    - 压缩上下文后，显存占用降低。
    - 批量大小（batch size）可以显著提升，加速模型训练。
- FramePack的效果
  - 计算效率大幅提升
    - 视频生成的计算成本接近图像生成。
    - 可以处理更多帧、更长时间的视频片段。
  - 兼容并优化已有视频扩散模型
    - 可以在已有模型基础上微调 FramePack。
    - 利用更“平衡”的扩散调度器，减少时间步的偏移。
    - 带来更好的画面质量和流畅性。

1. Introduction

问题与挑战
- 核心问题：视频逐帧（或逐片段）预测模型存在两大关键问题：
  - 遗忘（forgetting）：模型难以记住早期内容，导致时间依赖性不一致。
  - 漂移（drifting）：逐帧预测中误差累积导致视觉质量迭代退化（曝光偏差 exposure bias）。
- Dilemma：缓解遗忘的方法（如增强记忆）会加速误差传播（加剧漂移）；而抑制漂移的方法（如打断时间依赖）会加重遗忘。
现有方法的局限性
- 遗忘的简单解法：直接编码更多帧会导致计算复杂度爆炸（Transformer注意力复杂度为平方级）。
  - 效率问题：视频帧间存在大量冗余，全上下文编码效率低下。
  - 漂移的复杂性：
    - 误差来源：单帧初始错误。
    - 误差影响：通过记忆机制传播累积，形成矛盾——强记忆机制既减少初始错误（抑制漂移），又加速错误传播（加剧漂移）。
解决方案框架
- FramePack结构：
  - 抗遗忘：通过重要性压缩输入帧，固定上下文长度上限，支持更多帧编码且不增加计算负担。
    - 抗漂移采样方法：
      - 打破因果预测链，引入双向上下文。
      - 具体策略：
        
        端点优先生成：先生成关键帧（endpoint frames），再填充中间内容。
        
        逆向时序采样：反向生成，逐步逼近已知高质量帧。
技术优势与发现
- 兼容性：可微调现有视频扩散模型（如HunyuanVideo、Wan）。
- 实验发现：
  - 全视频生成的调度器问题：
    - 由于一次性处理长序列，需在极端时间步（如极早或极晚的 timestep）分配更多权重，以覆盖全局信息。
    - 例如：早期时间步需快速降噪以捕捉整体运动，后期时间步需精细调整细节，导致调度器
      
      激进（aggressive），表现为：
      - 时间步间隔不均匀（如大跨度跳跃）。
      - 噪声强度变化剧烈（如突然从高噪声切换到低噪声）。
  - 逐帧预测的调度器优势：
    - 单步处理的张量小，允许调度器更平衡地分配时间步：
      - 时间步间隔更均匀（如线性或余弦调度）。
      - 噪声强度变化平缓（避免极端跳跃）。
    - 结果：
      - 模型在每个时间步都能充分优化，避免因激进调度导致的局部过拟合或欠优化。
      - 误差在单帧内更容易被修正，不会因极端时间步累积到后续帧（缓解漂移的副作用）。
  - 逐帧预测的每步张量更小，支持更平衡的扩散调度器（减少极端时间步偏移）。
  - 温和的调度器可能间接提升视觉质量，超越解决遗忘/漂移的直接目标。

2. 相关工作

2.1 Anti-forgetting and Anti-drifting

核心问题：视频生成中遗忘（forgetting）和漂移（drifting）的权衡与现有解决方法。

噪声调度与增强（Noise Scheduling & Augmentation）
- 方法：通过修改历史帧的噪声水平或时序分布，减少对过去帧的依赖。
  - 典型工作：在特定时间步或频率上添加噪声，打断误差传播链。
  - 作用：降低历史帧的误差累积（抗漂移），但可能加剧遗忘（因削弱时间依赖性）。
  - 本文实验：通过消融研究分析历史帧加噪声的影响。
基于分类器无关引导（Classifier-Free Guidance, CFG）的方法
- 方法：对历史帧施加不同的掩码或噪声强度，放大遗忘-漂移的权衡效应。
  - 典型工作：通过引导策略调整历史帧的噪声水平。
  - 本文实验：包含基于引导的噪声调度测试。
锚定帧（Anchor Frames）规划
- 方法：使用关键帧（如参考图像）作为视频生成的规划基准。
  - 典型工作：
    - 锚定帧约束生成内容的一致性。
    - 利用图像/视频锚点进行时序内容规划。
潜在空间压缩（Latent Space Compression）
- 方法：压缩视频表示的潜在空间，提升计算效率。
  - 典型工作：
    - LTXVideo：高压缩潜在空间实现高效视频扩散。
    - Pyramid-Flow：金字塔结构的多尺度潜在去噪，降低计算成本。
    - FAR ：多级因果注意力结构，建立长短期上下文缓存（KV caches）。
    - HiTVideo ：分层标记器（tokenizers）结合自回归语言模型增强生成。
遗忘与漂移的权衡讨论
- 关键发现：
  - CausVid ：因果性视频生成器在长视频末尾出现质量下降（漂移），且视频长度受限。
  - DiffusionForcing ：漂移源于训练与推理阶段的观测差异导致的误差累积。
  - Wang et al. ：强记忆机制可能加速错误传播（漂移加剧）。

2.2 Long Video Generation

核心问题：如何扩展视频生成长度并保持时序一致性。

潜在扩散与多提示生成
- 典型工作：
  - LVDM ：基于潜在扩散的长视频生成。
  - Phenaki ：通过文本提示序列生成可变长度视频。
  - Gen-L-Video ：多文本条件视频的时序协同去噪。
无需训练的扩展方法
- 典型工作：
  - FreeNoise ：通过噪声重调度（rescheduling）扩展预训练模型。
分层与分布式生成
- 典型工作：
  - NUWA-XL ：扩散叠加扩散（Diffusion-over-Diffusion）的粗到细生成。
  - Video-Infinity ：分布式生成突破计算限制。
一致性长视频生成
- 典型工作：
  - StreamingT2V ：无硬切片的动态可扩展视频生成。
  - CausVid ：通过蒸馏将双向模型转为快速自回归模型。
其他前沿技术
- 方法分类：
  - GPT式架构（ViD-GPT）、多事件生成（MEVG）。
  - 注意力控制（DiTCtrl）、时序精控（MinT）。
  - 历史引导（HistoryGuidance）、统一扩散（DiffusionForcing）。
  - 谱混合注意力（FreeLong）、测试时训练（TTT ）。

2.3 Efficient Architectures for Video Generation

核心问题：提升视频生成模型的效率。

线性注意力（Linear Attention）
- 方法：重构线性运算降低注意力复杂度 $O(N^2) \rightarrow O(N)$ 。
  - 典型工作：通过核函数近似或矩阵分解优化。
稀疏注意力（Sparse Attention）
- 方法：仅计算重要标记对（token pairs）的注意力。
  - 典型工作：基于局部性、哈希或可学习稀疏模式。
低比特计算（Low-bit Computation）
- 方法：量化模型权重和激活值（如FP16 → INT8）。
  - 典型工作：通用量化；注意力专用量化。
隐藏状态缓存（Hidden State Caching）
- 方法：跨扩散时间步复用中间计算结果。
  - 典型工作：避免冗余计算，提升推理速度。
蒸馏（Distillation）
- 方法：将大模型知识迁移到小模型或减少采样步数。
  - 典型工作：步数蒸馏、架构蒸馏。

3. 方法

任务描述
- 目标：通过逐帧（或逐片段）预测生成连续视频。
  - 每次预测 $S$ 帧（通常 $S = 1$ 或小数值），条件依赖于 $T$ 帧历史输入（ $T\gg S$ ）。
    - 输入帧： $\in \mathbb{R}^{T \times h \times w \times c}$
    - 输出帧： $\in \mathbb{R}^{S \times h \times w \times c}$
模型类型：基于 扩散Transformer（DiT） 的预测模型，所有帧和像素均在潜在空间中操作。
核心挑战：上下文长度爆炸
- 单帧上下文长度：每帧的token数 $L_f$ （例如Hunyuan/Wan/Flux模型中480p的帧的 $L_f \approx 1560$ ）。
- 总上下文长度： $L = L_f (T + S)$
  - 当历史帧数 $T$ 较大时（如长视频生成）， $L$ 急剧增长，导致计算不可行（Transformer注意力复杂度为 $O(L^2)$ ）。

3.1 FramePack

3.1.1 核心思想

基于时间重要性的帧压缩

重要性优先级假设
- 观察：输入帧 $F_0, F_1, \dots, F_{T-1}$ 对下一帧预测的贡献不同。
- 简化假设：时间邻近性反映重要性（Temporal Proximity Prior）。
  - 最近帧 $F_0$ （最新）最重要，最远帧 $F_{T-1}$ （最旧）最不重要。
  - 注：实际可扩展至其他重要性度量（如运动强度、语义关键性）。
目标
- 通过动态分配每帧的上下文长度（token数），实现：
  - 重要帧（如 $F_0$ ）保留更多细节（高token数）。
  - 非重要帧（如 $F_{T-1}$ ）高度压缩（低token数）。
  - 总上下文长度 $L$ 收敛到固定上界，与历史帧数 $T$ 无关。

3.1.2 压缩机制设计

长度函数 $\phi(F_i)$
- 定义：在VAE编码和Transformer Patchifying之后，第 $i$ 帧 $F_i$ 的上下文长度（token数，不改变token的维度）为：
  $\phi(F_i) = \frac{L_f}{\lambda^i} \quad (\lambda > 1)$
  - $L_f$ ：原始单帧token数（如480p帧的1560）
  - $\lambda$ ：压缩因子
实现方式：动态Patchify核
- 操作：通过调整Transformer输入层的 patchify核尺寸 实现压缩。
  - 示例：若 $\lambda=2$ , $i = 5$ ，则核体积 $\lambda^i = 32$ ，可能的核形状：
    - 空间维度： $\times 2 \times 2$ （长×宽×通道）。
    - 时间维度： $\times 4 \times 4$ （若需时序感知）。
  - 效果：核越大 → 下采样率越高 → token数越少。

3.1.3 总上下文长度数学性质

公式
$\cdot L_f + L_f \cdot \sum_{i=0}^{T-1} \frac{1}{\lambda^i} = S \cdot L_f + L_f \cdot \frac{1 - 1/\lambda^T}{1 - 1/\lambda}$
- 第一项 $\cdot L_f$ ：预测帧 $X$ 的原始token数。
- 第二项：历史帧压缩后的总token数（等比数列求和）。
极限行为( $\to \infty$ )
$\lim_{T \to \infty} L = \left( S + \frac{\lambda}{\lambda - 1} \right) \cdot L_f$
结论：
- 当历史帧数 $T$ 趋近无穷时， $L$ 收敛到固定值。
- 因为 $L$ 收敛为固定值，所以复杂度瓶颈和 $T$ (即帧数) 无关
- 示例：若 $\lambda=2$ , $S = 1$ , $L_f=1560$ ：
  $L_\infty = \left(1 + \frac{2}{2-1}\right) \cdot 1560 = 4680 \quad (\text{与} T \text{无关})$
$\lambda$ 选择
硬件优先：默认选择 $λ = 2$ 的幂次核尺寸（如 $(4, 4, 4)$ ）。
灵活调整：通过复制/舍弃级数项适配不同压缩需求（如长视频需更高压缩率）。
核尺寸权衡：
- 静态内容 → 大空间核。
- 动态内容 → 大时间核。
- 3D Patchify核的维度表示
  - 3D核尺寸： $p_f,p_h,p_w)$
    - $p_f$ ：时间维度（帧数）的patch跨度。
    - $p_h,p_w$ ：空间维度（高度、宽度）的patch大小。
  - 物理意义：
    - 每个3D核将输入视频块 $p_f \times p_h \times p_w \times d$ （ $d$ 为通道数）压缩为1个token。
与FramePack结合：动态核调整实现抗遗忘（保留关键帧细节）与抗漂移（压缩非关键帧）。

3.1.4 Independent patchifying parameters

独立patchifying的参数

核心问题
- 不同压缩率下，深度神经网络提取到的特征是不同的，比如对一帧用压缩率 (2, 4, 4) 和 (8, 16, 16) 会产生显著不同的空间-时间表示。
- 所以不能一个卷积（用于将patch投影成token）用于所有压缩率。
实验发现：
- 如果每种压缩率都配一套独立的 projection 参数（即独立的卷积核），能让模型学习更稳定，效果更好。
- 因为不同尺度下的图像内容表达方式、重要性差异太大，不宜共用参数。
具体做法
- 选定3种主流压缩率来处理视频帧： $(2, 4, 4) 、 (4, 8, 8) 、 (8, 16, 16)$
- 对每种压缩率，他们都配了一套 单独的神经网络层 来做输入编码
- 处理极端压缩
  - 如果某些帧需要更极端压缩（如 $(16, 32, 32)$ ），那就先做一次下采样（如用2×2×2卷积降分辨率）；
  - 然后用已有的最大卷积核 (8, 16, 16) 来继续编码。
  - 优势：避免无限制地增加新的 projection 层数量，提高参数复用性。
- 为了加速收敛，防止训练不稳定：
  - 新的 projection 层会从已有的预训练模型中“插值”初始化（比如从 HunyuanVideo 的 (2,4,4) patch 投影参数中插值得到）。
  - 插值初始化 = 保留已有模型的知识 + 提升收敛效率 + 避免随机初始化带来的不稳定。

3.1.5 Tail options

尾帧处理

问题背景
- FramePack压缩过程通过一个 动态分配机制：
  - 重要帧 → 使用更细致的压缩（低压缩率）
  - 不重要帧（如尾部冗余帧）→ 使用更强压缩（高压缩率）或删除
- 现实中，如果视频非常长，最后那一部分帧可能：
  - 已经被压缩得非常极端（比如 16×32×32）
  - 再压缩下去就没法再分出一个 patch（比如只剩 1 个 latent 像素）
  - 这就是所谓的 “tail 区域”：即最后这部分帧，已不足以组成一个 patch 或 token。
处理方法
1. 直接删除尾帧（Delete the tail）
  - 如果某些尾帧压缩后不足以形成一个 token，就不处理了，直接舍弃。
    - 好处：保持固定上下文长度，计算量小。
    - 缺点：丢掉一些帧（但这些帧本来就不重要）。
2. 让每个尾帧单独增加 1 个 latent token
  - 虽然不能组成 patch，但每一帧都映射成 1 个 token 加进 transformer。
  - 意味着上下文长度 轻微增加（每多一帧就多 1 个 token）。
  - 更保守地保留全部信息，但轻微打破 context length 固定的假设。
3. 把所有尾帧做全局平均池化，然后用最大 kernel 编码为一个 token
  - 把所有 tail 帧的 latent 特征做 global average pooling（类似做一个平均帧）。
  - 然后用预设的最大压缩核（如 8×16×16）生成一个 token，代表全部尾帧。
  - 既保留信息，也保证 context 长度不变。
实验观察
- 这些三种策略在视觉效果上的差异很小（visual differences are relatively negligible），说明对尾帧的具体处理策略并不是特别敏感，毕竟这些帧不重要。

3.1.6 RoPE alignment

RoPE对齐

问题背景
- FramePack 对输入视频帧进行压缩编码 —— 有的帧用 2×4×4 的核，有的用 8×16×16 ，即
  - 每个帧被编码成不同数量的 token，导致上下文长度不一致。
- RoPE 是位置编码机制，需要和上下文长度对齐。如果不处理这些差异，Transformer 就会“搞不清楚”哪个 token 来自哪个位置。
解决方案
- 对 RoPE 相位本身进行下采样（平均池化）
- 使得位置编码（phase）与 压缩后 token 的空间位置数量一致，例如
  - 原视频帧有 32×32 空间分辨率，RoPE 的相位是 32×32 个位置
  - 用了 4×4 的压缩核，帧变成了 8×8 token
  - 那就把原始 RoPE 的相位做 avg_pooling(kernel=4x4)，变成 8×8 的相位
  - 然后这个新相位用于编码压缩后的 token

3.2 FramePack Variants

典型几何级数（Typical Geometric Progression）
- 压缩率：按几何级数递减（如 $\frac{1}{2}, \frac{1}{4}, \frac{1}{8}, \frac{1}{16}$ ）。
- Patchify核：核尺寸逐级增大（如 $\rightarrow (1,8,8)$ ），对应更粗粒度的分块。
- 特点：
  - 最近帧 $F_0$ 保留完整token数（无压缩），旧帧逐步压缩。
  - 计算效率高，但可能丢失远距离依赖。
带重复级别的级数（Progression with Duplicated Levels）
- 压缩率：非连续递减，部分级别重复（如 $\frac{1}{4}, \frac{1}{4}, \frac{1}{16}, \dots$ ）。
- Patchify核：相同核尺寸重复使用（如两个 $(1, 4, 4)$ 连续应用）。
- 特点：
  - 平衡压缩率与信息保留，避免某些帧被过度压缩。
  - 适合中等长度视频，需兼顾局部与全局信息。
时空联合分块级数（Geometry Progression with Temporal Kernel）
- 压缩率：时空联合分块（如 $(4, 4, 4)$ 表示跨4帧×4×4空间分块）。
- Patchify核：核尺寸包含时间维度（如 $(8, 8, 4)$ ）。
- 特点：
  - 显式利用时序冗余，减少总token数。
  - 计算代价最低，但可能模糊快速运动细节。
重要起始级数（Progression with Important Start）
- 压缩率：与 1 相同，但强制首帧 $F_{T-1}$ 保留完整token数。
- Patchify核：同 1 ，但首帧不压缩。
- 特点：
  - 首帧（如场景初始状态）作为长期记忆锚点，缓解遗忘。
  - 适合场景切换较少的长视频。
对称级数（Symmetric Progression）
- 压缩率：首尾帧对称分配高token数（如 $F_{T-1}$ 和 $F_0$ 均无压缩）。
- Patchify核：同 4 ，但两端帧均保留完整信息。
- 特点：
  - 双向依赖增强，适合需全局规划的任务（如文本到视频）。
  - 计算成本略高，但抗漂移能力更强。

3.3 Anti-drifting Sampling

抗漂移采样

问题定义
- Drifting：在基于逐帧预测（next-frame prediction）的视频生成中，生成的画面随着帧数增加会变模糊、失真、甚至偏移主题
  - 产生原因：模型只“从前往后看”（单向预测、严格因果）时，漂移就容易出现
解决方法：提供未来帧的访问能力
- 让模型看到一个“未来帧”（哪怕只是一帧），也会显著缓解漂移现象。
  - 启发式结论：视频的质量依赖于“双向上下文”，而非仅靠因果关系。
采样方式
1. 普通因果采样
  - 就是传统的“从已知帧开始，一帧一帧往后生成”
  - 完全因果，每次生成的帧依赖于前面的内容
  - 缺点：越往后越不稳定 → 漂移现象严重
2. 双向采样
  - 第一轮就生成“开头帧”和“结尾帧”
  - 后续轮次只负责填补中间的内容（inpainting）
    - 好处：
      - 生成过程有两个锚点（begin + end），
      - 中间帧是受控生成 → 不易漂移
  - 适合生成中等长度的高质量视频
3. 反向采样
  - image-to-video中：
    - 用户给的是高质量的第一帧
    - 我们要生成后续帧，但要逐步逼近第一帧的风格和语义
  - 即：
    - 第一轮仍然生成末尾帧（作为 anchor）
    - 然后反向采样 + 插值，保证前后帧都逼近第一帧
  - 特别适合 image-to-video / prompt-to-video 任务
RoPE with random access
- 反向采样的问题：非连续RoPE编码
- 解决方法：
  - RoPE 编码仍然是“全局时间索引感知”的
  - 但当我们不处理某些帧时（例如 frame 1~9），我们不生成这些帧的 RoPE 相位
  - 只保留 frame 0、10、30、50 的 RoPE phase，且保持其真实时间位置
  - 直观做法
```
# 原始位置 index:
positions = [0, 10, 30, 50]

# 假设你有一个 RoPE 编码器，支持任意 index 输入：
rope_encoding = get_rope_encoding(positions)
```

4. 实验

4.1 消融实验命名规范

命名结构的总体格式：

结构形如：
```
td_f16k4f4k2f1k1_g9_x_f1k1
```

可以被拆解为几个部分：

字段名	含义
td	tail 处理方式（如 td、ta、tc）
f16k4f4k2f1k1	主干压缩结构（表示不同帧段使用了不同的 kernel）
g9	表示要生成的帧数量
x	表示“跳过”部分帧（防漂移）
f1k1	表示在 `x` 之后使用的 anchor 帧压缩设置（例如后端锚点）

Kernel 编码结构解释

完整表示法：

k1h2w2 → 表示 kernel=(1帧, 2高, 2宽)
k2h4w4 → 表示 kernel=(2帧, 4高, 4宽)

简写（常用）方式：

FramePack 为了简洁，引入如下缩写：

简写	实际 kernel
k1	(1, 2, 2)
k2	(2, 4, 4)
k4	(4, 8, 8)
k8	(8, 16, 16)

举例：

f16k4 → 表示 16 帧用 k4 编码（即 kernel=(4,8,8)）
f4k2  → 表示 4 帧用 k2 编码（即 kernel=(2,4,4)）
f1k1  → 表示 1 帧用 k1 编码（即 kernel=(1,2,2)）

三种tail的策略

代码	含义
`td`	删除这些尾帧（delete）
`ta`	先使用 3D Pooling (1,32,32)，再找最接近的 kernel 编码（append）
`tc`	对 tail 全局 average pooling，再编码（compress）

Sampling 采样策略对应的命名结构
- Vanilla 采样（顺序采样 Fig.2-a）
  - td_f16k4f4k2f1k1_g9
    - 删除尾帧（td）
    - 使用 f16k4f4k2f1k1 的三层结构来压缩连续的19帧的视频段
    - 然后依次生成 9 帧（g9）
- Anti-drifting 采样（双向锚点，Fig.2-b）
  - td_f16k4f4k2f1k1_g9_x_f1k1
    - 在 Vanilla 基础上加了 _x_f1k1
    - 表示：跳过中间帧，在最后加了一个锚点帧（也用 k1 编码）
    - 所以是“双向锚定”，先生成开头和结尾，再补中间 → 防漂移
- Inverted anti-drifting（倒序采样，Fig.2-c）
  - f1k1_x_g9_f1k1f4k2f16k4_td
    - 倒过来：先以末尾帧为起点（f1k1）
    - 加上前置 anchor，然后生成中间（g9）
    - 再“反方向”补充前段（f4k2f16k4）
    - 最后处理 tail（td）
跳帧 x 的作用
- 把中间帧留空，模型之后再去插补这些帧。
  - f1k1 + x + f1k1：提供两端锚点帧
  - g9：指在中间补出 9 帧
  - 模型知道前后锚点，就不会发生质量飘移

4.2 实现细节

项目	内容
框架模式	Text-to-video 与 Image-to-video
模型	Wan2.1 和 HunyuanVideo（推荐）
关键修改	冻结 LLaMA、多模态清除、使用 SigLip、持续训练
数据集	参考 LTXVideo，质量过滤 + 分辨率桶
训练配置	Adafactor、1e-5 学习率、梯度裁剪 0.5
硬件支持	A100/H100，支持大 batch
训练时间	ablation 实验 48h，最终模型 7 天
优势	快速、适合实验室，视频生成清晰、稳定

4.3 评估

文本到视频（Text-to-video） 和 图像到视频（Image-to-video） 的任务分别测试了 512 个来自真实用户的提示（prompts）。这些提示来自 真实用户，以确保数据集的多样性和 真实世界的适用性。
测试的视频时长设定：
- 长视频：默认使用 30秒 作为标准时长；
- 短视频：默认使用 5秒作为标准时长。

漂移测量：起始-结束对比度（start-end contrast）。
- 定义
  - 对于任意一个视频质量指标 $M$ ，定义漂移度量为： $\Delta M_{\text{drift}}(V) = |M(V_{\text{start}}) - M(V_{\text{end}})|$
    - $V$ ：待测视频
    - $V_{\text{start}}$ ：视频的前15%的帧
    - $V_{\text{end}}$ ：视频的后15%的帧
    - $M$ ：任意质量度量（如运动评分、图像质量等）
- 含义
  - 差值越大，表示前后质量差异越大，漂移越严重；
  - 使用绝对值是为了忽略生成顺序的方向性（比如有的模型从前往后生成，有的从后往前）

你可能感兴趣的:(计算机视觉,论文阅读,计算机视觉,AIGC)

GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
Python Gradio：实现交互式图像编辑 PythonAI编程架构实战家 Python编程之道 python 开发语言 ai
PythonGradio：实现交互式图像编辑关键词：Python,Gradio,交互式图像编辑,计算机视觉,深度学习,图像处理,Web应用摘要：本文将深入探讨如何使用Python的Gradio库构建交互式图像编辑应用。我们将从基础概念开始，逐步介绍Gradio的核心功能，并通过实际代码示例展示如何实现各种图像处理功能。文章将涵盖图像滤镜应用、对象检测、风格迁移等高级功能，同时提供完整的项目实战案例
论文阅读：《针对多目标优化和应用的 NSGA-II 综述》一些关于优化算法的简介行然梦实优化算法论文阅读算法数学建模
前言提醒：文章内容为方便作者自己后日复习与查阅而进行的书写与发布，其中引用内容都会使用链接表明出处（如有侵权问题，请及时联系）。其中内容多为一次书写，缺少检查与订正，如有问题或其他拓展及意见建议，欢迎评论区讨论交流。内容由AI辅助生成，仅经笔者审核整理，请甄别食用。文章目录前言一些关于优化算法的缩写优化算法Ma,Haiping&Zhang,Yajing&Sun,Shengyi&Liu,Ting&S
【人工智能入门必看的最全Python编程实战（1）】 DFCED 人工智能 python 开发语言深度学习找工作就业
--------------------------------------------------------------------------------------------------------------------1.AIGC未来发展前景未完持续…1.1人工智能相关科研重要性拥有一篇人工智能科研论文及专利软著竞赛是保研考研留学深造以及找工作的关键门票！！！拥有一篇人工智能科研论文
视觉Transformer还有哪些点可以研究？怎么应用？计算机视觉工坊 3D视觉从入门到精通学习算法开源
0.这篇文章干了啥？今天笔者为大家推荐一篇最新的综述，详细总结了Transformer的网络架构、优化策略、发展方向，还会定期更新Github，研究注意力机制的小伙伴一定不要错过。注意机制有助于人类视觉系统有效地分析和理解复杂场景，它能够聚焦于图像的关键区域，同时忽略无关紧要的部分。受此概念启发，注意机制已经被引入到计算机视觉（CV）中，以动态地为图像中的不同区域分配权重。这使得神经网络能够专注于
AGI和AIGC傻傻分不清楚，一篇文章告诉你如何分辨！
Look！我们的大模型商业化落地产品更多AI资讯请关注Free三天集训营助教在线为您火热答疑‍什么是AGI(人工通用智能)?AGI是ArtificialGeneralIntelligence的缩写，中文翻译为“通用人工智能”，该术语指的是机器能够完成人类能够完成的任何智力任务的能力。与狭义的人工智能(ANI)不同，狭义的人工智能是为特定领域或问题而设计的，而AGI旨在实现一般的认知能力，能够适应任
2025年海外短剧CPS分销系统开发：技术架构与商业化实战指南
一、市场爆发：万亿级赛道的结构性机遇2025年海外短剧市场迎来指数级增长，SensorTower数据显示，仅第一季度应用内购收入就达7亿美元，全年预计突破45亿美元。美国贡献49%收入，东南亚以9%增速成为新兴增长极。这种爆发式增长源于三大驱动力：用户行为变迁：全球短视频用户突破20亿，微短剧月活用户仅8000万，渗透率不足10%，存在11倍增长空间技术赋能创新：AI生成内容（AIGC）降低制作成
Python_day54Inception网络及其思考且慢.589 Python_60 python 开发语言
一、inception网络介绍今天我们介绍inception，也就是GoogleNet传统计算机视觉的发展史从上面的链接，可以看到其实inceptionnet是在resnet之前的，那为什么我今天才说呢？因为他要引出我们后面的特征融合和特征并行处理这些思想。Inception网络，也被称为GoogLeNet，是Google团队在2014年提出的经典卷积神经网络架构。它的核心设计理念是“并行的多尺度
AI 绘画 + 编程：10 分钟生成个性化艺术作品大力出奇迹985 人工智能
本文围绕Python+OpenCV实现自动人脸识别门禁系统展开，先概述系统的基本构成与作用，再从系统核心技术、开发实现步骤、功能扩展方向、实际应用场景及优化改进策略五个方面详细阐述，最后总结系统的价值与发展前景，为相关开发和应用提供全面参考。一、系统核心技术解析人脸识别技术是门禁系统的核心，其关键在于对人脸特征的精准提取与匹配。OpenCV作为开源计算机视觉库，提供了丰富的人脸检测算法，如Haar
5个必知的AIGC工具，轻松打造爆款虚拟偶像 AI原生应用开发 AI 原生应用开发实战 AIGC ai
5个必知的AIGC工具，轻松打造爆款虚拟偶像关键词：AIGC工具、虚拟偶像、AI生成内容、数字人建模、智能交互、语音合成、动画生成摘要：本文深度解析5款前沿AIGC工具在虚拟偶像打造中的核心应用，涵盖从形象设计、语音生成到动态交互的全流程技术实现。通过MidJourney、D-ID、MetaHuman、RunwayML、VoiceMaker等工具的原理剖析、操作指南及实战案例，揭示如何利用AI技术
【AI大模型：前沿】43、Mamba架构深度解析：为什么它是Transformer最强挑战者？无心水架构 transformer Mamba Mamba架构 AI大模型系统开发实战 AI大模型高手开发 AI大模型系统实战
Transformer架构自2017年诞生以来，一直是NLP、计算机视觉等领域的“统治级”模型架构。但随着序列长度需求的增长（如128K长文本处理、基因组学超长序列分析），其自注意力机制的O(n2)O(n^2)O(n2)计算复杂度成为难以逾越的瓶颈。2023年底，由AlbertGu和TriDao等人提出的Mamba架构，通过创新的“选择性状态空间模型（SelectiveSSM）”实现了线性复杂度（
《揭秘AI应用架构师在智能虚拟人设计系统中的创新思维》 SuperAGI架构师的AI实验室人工智能 ai
揭秘AI应用架构师在智能虚拟人设计系统中的创新思维关键词：AI应用架构师、智能虚拟人、系统设计、创新思维、自然语言处理、计算机视觉、实时交互摘要：智能虚拟人已从科幻走进现实，无论是直播间的虚拟主播、手机里的智能助手，还是元宇宙中的数字分身，它们背后都离不开AI应用架构师的“隐形设计”。本文将以“总设计师视角”，用生活化的比喻和实例，拆解AI应用架构师在智能虚拟人系统设计中的创新思维——从“让虚拟人
AIGC 领域 AI 写作在电商文案中的应用技巧 SuperAGI架构师的AI实验室 AI大模型应用开发宝典 AIGC 人工智能 easyui ai
AIGC领域AI写作在电商文案中的应用技巧关键词：AIGC、AI写作、电商文案、内容生成、自然语言处理、营销自动化、个性化推荐摘要：本文深入探讨了AIGC（人工智能生成内容）技术在电商文案创作中的应用技巧。文章首先介绍了AIGC的基本概念和发展现状，然后详细分析了AI写作在电商领域的核心应用场景和技术原理。通过具体的算法解析、数学模型和实际案例，展示了如何利用AI技术提升电商文案的创作效率和质量。
AIGC时代，营销人需要掌握的5项新技能 SuperAGI架构师的AI实验室 AI大模型应用开发宝典 AIGC ai
AIGC时代，营销人需要掌握的5项新技能关键词：AIGC、营销转型、内容生成、数据驱动、人机协作、技能升级、数字营销摘要：随着生成式人工智能(AIGC)技术的快速发展，营销行业正在经历前所未有的变革。本文详细分析了在AIGC时代营销人必须掌握的5项核心新技能，包括AIGC工具应用、数据思维、创意管理、人机协作和伦理意识。通过生动的案例和实用的建议，帮助营销从业者顺利实现技能升级，把握AI时代的营销
AI人工智能为空间智能领域带来的科技革新 AI云原生与云计算技术学院 AI云原生与云计算人工智能科技 ai
AI人工智能为空间智能领域带来的科技革新关键词：人工智能、空间智能、计算机视觉、SLAM、空间计算、增强现实、自动驾驶摘要：本文将深入探讨人工智能如何革新空间智能领域。我们将从基本概念出发，逐步分析AI在空间感知、理解和交互方面的突破性进展，包括SLAM技术、3D重建、空间计算等核心应用。通过生动的比喻和实际案例，揭示AI如何赋予机器"空间思维"能力，并展望这一技术融合的未来发展趋势。背景介绍目的
基于深度学习的图像分类：使用ShuffleNet实现高效分类 Blossom.118 机器学习与人工智能深度学习分类人工智能机器学习数据挖掘 python 目标检测
前言图像分类是计算机视觉领域中的一个基础任务，其目标是将输入的图像分配到预定义的类别中。近年来，深度学习技术，尤其是卷积神经网络（CNN），在图像分类任务中取得了显著的进展。ShuffleNet是一种轻量级的深度学习架构，专为移动和嵌入式设备设计，能够在保持较高分类精度的同时，显著减少计算量和模型大小。本文将详细介绍如何使用ShuffleNet实现高效的图像分类，从理论基础到代码实现，带你一步步掌
AIGC领域MCP模型上下文协议：数据处理的新方案 AI大模型应用工坊 AIGC ai
AIGC领域MCP模型上下文协议：数据处理的新方案关键词：AIGC、MCP模型、上下文协议、多模态数据处理、动态上下文管理、长序列建模、语义连贯性摘要：随着AIGC（人工智能生成内容）技术的快速发展，多模态生成、长文本创作、跨场景对话等任务对上下文管理提出了更高要求。传统上下文处理方案因碎片化、语义断层、动态适应性差等问题，难以满足复杂场景需求。本文聚焦AIGC领域的MCP（Multi-Conte
《零基础入门AI：从图像梯度到凸包特征检测（OpenCV图像特征提取）》竹子_23 OpenCV入门 opencv 人工智能计算机视觉
一、图像梯度处理：理解像素变化的本质1.1图像梯度基础图像梯度是计算机视觉中的核心概念，它描述了图像中像素强度的变化情况：梯度方向：像素值变化最剧烈的方向（垂直于边缘）梯度幅度：像素值变化的强度（值越大表示边缘越明显）物理意义：就像地形图中的等高线，梯度大的地方相当于陡坡，梯度小的地方相当于平地1.2垂直边缘提取垂直边缘是图像中物体左右边界形成的线条：特征：水平方向上像素值发生突变应用场景：文档扫
OpenCV基础02_图像预处理白槿_cha 计算机视觉基础 opencv 人工智能计算机视觉笔记
图像预处理在计算机视觉和图像处理领域，图像预处理是一个重要的步骤，它能够提高后续处理（如特征提取、目标检测等）的准确性和效率。OpenCV提供了许多图像预处理的函数和方法，一些常见的图像预处理操作：图像色彩空间转换图像大小调整图像仿射变换图像翻转图像裁剪图像二值化处理图像去噪边缘检测图像平滑处理图像形态学一、图像翻转cv2.flip是OpenCV库中的一个函数，用于翻转图像。翻转可以是水平翻转、垂
电表箱识别漏检率高？陌讯算法实测降 90%
在电力巡检领域，电表箱状态识别一直是计算机视觉技术落地的难点。传统人工巡检模式下，一个台区的200个电表箱需2名巡检员耗时1天完成，且受光线、天气影响，误判率常超过15%。而采用普通开源算法部署的自动识别系统，又面临箱体污渍遮挡、表计型号混杂、边缘计算设备算力有限等多重挑战，实际商用时mAP（平均精度）往往跌破70%，难以满足电力行业的可靠性要求技术解析：从传统方法到陌讯创新架构传统电表箱识别多采
以AI人工智能为核心，发展空间智能 AI智能探索者 AI Agent 智能体开发实战人工智能 ai
以AI人工智能为核心，发展空间智能关键词：人工智能、空间智能、智能系统、机器学习、计算机视觉、物联网、自动化技术摘要：本文围绕"以AI人工智能为核心发展空间智能"这一主题，系统解析空间智能的技术架构与实现路径。通过揭示AI与空间智能的核心关联，深入探讨机器学习、计算机视觉、数字孪生等关键技术如何赋能空间数据的感知、处理与决策。结合智能建筑、智慧城市等实际场景，展示从算法原理到工程落地的完整技术链条
探索未来标注新纪元：AutoLabelImg 多功能自动标注工具徐耘馨
探索未来标注新纪元：AutoLabelImg多功能自动标注工具在计算机视觉领域，高质量的数据标注是模型训练的关键一步，而AutoLabelImg正是这样一个旨在提升效率的开源标注工具。它不仅继承了著名的labelImg的基础特性，还创新性地加入了多种高级功能，为开发者和研究人员提供了一个全新的标注体验。项目简介AutoLabelImg是一款强大的图像和视频标注工具，集成了自动化标注、追踪标注、放大
无人机正摄影像自动识别与矢量提取系统 pk_xz123456 算法 python 无人机算法数据挖掘深度学习网络媒体
无人机正摄影像自动识别与矢量提取系统1.项目概述本项目旨在开发一个基于Python的自动化系统，能够从TIFF格式的无人机正摄影像中识别并提取多种地物要素，包括水边线、道路、桥梁、植被图斑、房屋、趸船和护岸。系统将采用深度学习与计算机视觉技术相结合的方法，实现高精度（95%以上）的自动识别，并将结果以带有相同坐标信息的矢量DWG/DXF格式保存。2.系统架构设计2.1总体架构系统采用模块化设计，主
百度大涨，AIGC视频生成模型蒸汽机将会给百度带来什么？
百度7月23日盘中表现强势，盘中一度涨4.49%。消息面上，百度旗下百度商业研发团队自研的AIGC视频生成模型蒸汽机(MuseSteamer)正式上线手机网页版，支持用户通过移动端一键生成电影级视频。百度的大涨我们该怎么分析？首先，百度股价的上涨反映了市场对其新推出的AIGC视频生成模型蒸汽机的高度认可和期待。这款模型能够支持用户通过移动端一键生成电影级视频，显示出百度在人工智能技术应用领域的持续
AI人工智能加持，人脸识别精准度飙升 AI大模型应用工坊人工智能 ai
AI人工智能加持，人脸识别精准度飙升：从模糊到清晰的技术革命关键词人脸识别、深度学习、神经网络、精准度优化、计算机视觉、特征提取、面部识别算法摘要想象一下，在一个拥挤的火车站，系统能在瞬间从数千人中准确识别出需要关注的个体；或者你的手机仅通过一瞥就能认出你，甚至在你戴着口罩时也能做到。这不是科幻电影的场景，而是当下AI驱动的人脸识别技术的真实能力。本文将深入探讨人工智能如何彻底改变人脸识别领域，从
opencv-day2-图像预处理1 谢眠 OpenCV opencv 计算机视觉
图像预处理在计算机视觉和图像处理领域，图像预处理能够提高后续处理（如特征提取、目标检测等）的准确性和效率。常见的图像预处理操作：图像色彩空间转换图像大小调整图像仿射变换图像翻转图像裁剪图像二值化处理图像去噪边缘检测图像平滑处理图像形态学图像翻转cv2.flip是OpenCV库中的一个函数，用于翻转图像。翻转可以是水平翻转、垂直翻转或同时水平和垂直翻转。这个函数接受两个参数：要翻转的图像和一个指定翻
使用PyTorch实现目标检测与跟踪认真写代码i pytorch 目标检测人工智能 Python
目标检测与跟踪是计算机视觉领域中的重要任务，它可以帮助我们在图像或视频中准确地定位和跟踪特定物体。PyTorch是一个流行的深度学习框架，提供了强大的工具和库，可以用于目标检测与跟踪的实现。本文将详细介绍如何使用PyTorch实现目标检测与跟踪，并提供相应的源代码。安装PyTorch和相关依赖首先，我们需要安装PyTorch和其他必要的依赖项。你可以通过以下命令使用pip安装PyTorch：pip
计算机视觉算法实现——汽车漆面缺陷检测
✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨1.领域介绍：工业质检的革命性突破1.1传统检测方法痛点分析汽车漆面作为车身的第一道防护层，其质量直接影响整车耐腐蚀性和美观度。传统检测依赖质检员目视检查（VT检测），存在三大核心问题：效率瓶颈：经验丰富的质检员完成单台整车检测需15-20分钟（数据来源：丰田2021年质检报告）主观偏
工业缺陷检测的计算机视觉方法总结思绪漂移计算机视觉人工智能缺陷检测
工业缺陷检测的计算机视觉方法总结传统方法特征提取方式：颜色：基于HSV/RGB空间分析，如颜色直方图、颜色矩等纹理：采用LBP、Haar、Gabor滤波器等算子提取纹理模式形状：基于Hu矩、Zernike矩等数学描述符刻画几何特性尺寸：通过连通域分析计算物体像素面积、周长等参数典型处理流程：手动设计特征提取算法建立规则分类器（如SVM、决策树）基于阈值分割目标区域深度学习方法核心特点：端到端学习：
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D