AI大模型应用工坊

AIGC时代下Transformer架构的演进与突破

关键词：Transformer架构、AIGC、自注意力机制、多模态学习、预训练模型、效率优化、长序列处理

摘要：在生成式人工智能（AIGC）爆发式发展的背景下，Transformer架构凭借其卓越的并行计算能力和长程依赖建模优势，已成为自然语言处理（NLP）、计算机视觉（CV）、多模态生成等领域的核心基础设施。本文系统梳理了Transformer自2017年提出以来的演进路径，深入剖析其核心原理、关键突破及在AIGC中的应用实践。通过数学模型、代码示例与实战案例，揭示Transformer如何推动AIGC从文本生成向多模态、长序列、个性化生成的跨越，并展望未来技术挑战与发展趋势。

1. 背景介绍

1.1 目的和范围

AIGC（Artificial Intelligence Generated Content）的核心是通过算法自动生成高质量、多样化的内容（文本、图像、视频、3D模型等）。自2020年GPT-3发布以来，AIGC进入指数级发展阶段，而支撑这一变革的底层技术基石正是Transformer架构。本文聚焦Transformer在AIGC场景中的演进，覆盖从原始架构到多模态扩展、效率优化的全周期技术突破，探讨其如何解决AIGC中的核心问题（如长序列依赖、多模态对齐、生成可控性）。

1.2 预期读者

本文面向人工智能从业者、算法工程师、AIGC研究者及技术爱好者。要求读者具备基础的深度学习知识（如神经网络、注意力机制），对NLP或CV领域有初步了解。

1.3 文档结构概述

本文结构如下：

核心概念：回顾原始Transformer的架构设计与核心组件；
演进路径：分阶段解析预训练模型、专用架构、多模态扩展、效率优化四大方向的技术突破；
算法与数学：通过公式与代码详解自注意力、预训练目标、多模态对齐等核心机制；
实战案例：基于Hugging Face库实现文本生成与图像生成的端到端流程；
应用场景：覆盖文本、图像、视频、多模态生成的典型AIGC场景；
工具与资源：推荐学习资料、开发框架及前沿论文；
未来趋势：探讨长序列处理、多模态融合、个性化生成等挑战与方向。

1.4 术语表

1.4.1 核心术语定义

自注意力（Self-Attention）：模型通过计算序列中元素间的相关性，动态分配权重的机制；
预训练（Pretraining）：在大规模无标注数据上训练基础模型，再通过微调适配下游任务；
多模态（Multimodal）：同时处理文本、图像、音频等多种模态数据的技术；
AIGC（生成式AI）：通过算法自动生成内容的人工智能分支；
稀疏注意力（Sparse Attention）：仅计算部分关键位置的注意力，降低计算复杂度。

1.4.2 相关概念解释

编码器-解码器（Encoder-Decoder）：原始Transformer的基础架构，编码器提取输入特征，解码器生成输出序列；
位置编码（Positional Encoding）：为序列中的位置信息建模，弥补自注意力对顺序不敏感的缺陷；
掩码语言模型（MLM）：BERT采用的预训练任务，随机遮盖输入中的部分token，模型预测被遮盖内容；
对比学习（Contrastive Learning）：通过区分正样本（相关数据对）与负样本（无关数据对）学习跨模态对齐。

1.4.3 缩略词列表

Transformer：Transformer（无缩写）；
NLP：自然语言处理（Natural Language Processing）；
CV：计算机视觉（Computer Vision）；
ViT：视觉Transformer（Vision Transformer）；
CLIP：对比语言-图像预训练（Contrastive Language-Image Pretraining）。

2. 核心概念与联系：从原始Transformer到AIGC引擎

2.1 原始Transformer的架构设计（2017）

2017年，Google Brain在论文《Attention Is All You Need》中提出Transformer，首次完全基于自注意力机制替代循环神经网络（RNN），解决了RNN无法并行计算、长序列依赖弱的问题。其核心架构如图2-1所示：

graph TD
    A[输入序列] --> B[词嵌入层]
    B --> C[位置编码]
    C --> D[编码器层1]
    D --> E[编码器层2]
    E --> F[...（共N层）]
    F --> G[编码器输出]
    H[输出序列] --> I[词嵌入层]
    I --> J[位置编码]
    J --> K[解码器层1（带掩码自注意力）]
    K --> L[解码器层1（编码器-解码器注意力）]
    L --> M[解码器层2]
    M --> N[...（共N层）]
    N --> O[线性层+Softmax]
    O --> P[生成序列]
    G --> L

图2-1 原始Transformer编码器-解码器架构

核心组件解析：

词嵌入（Token Embedding）：将离散的token（如单词、图像块）映射为连续向量；
位置编码（Positional Encoding）：通过正弦/余弦函数为每个位置生成唯一向量（ $PE_{pos,2i} = \sin(pos/10000^{2i/d_{model}})$ ， $PE_{pos,2i+1} = \cos(pos/10000^{2i/d_{model}})$ ），弥补自注意力对顺序的不敏感；
编码器（Encoder）：由N层相同子层组成，每层包含多头自注意力（Multi-Head Attention）和前馈网络（Feed Forward Network）；
解码器（Decoder）：每层包含掩码自注意力（防止看到未来token）、编码器-解码器注意力（对齐输入与输出）和前馈网络；
多头自注意力（MHA）：将自注意力拆分为h个独立头并行计算，增强模型对不同子空间的关注能力（公式见4.1节）。

2.2 Transformer与AIGC的本质联系

AIGC的核心是“理解-生成”：模型需先理解输入（如文本指令、图像描述），再生成符合语义、逻辑的内容。Transformer的自注意力机制天然适合建模长程依赖（如句子中的指代关系、图像中的全局上下文），而编码器-解码器架构则直接支持“输入-输出”的生成范式（如机器翻译、文本摘要）。

关键优势：

并行计算：自注意力的矩阵运算可完全并行，突破RNN的序列计算瓶颈，支持更大规模数据训练；
长程依赖：自注意力的全局感受野（每个token与所有token交互），解决了RNN的梯度消失问题；
可扩展性：通过堆叠更多层、增加隐藏维度，模型容量可灵活扩展以适配复杂任务。

3. 演进路径：从单模态到多模态，从低效到高效

Transformer的演进可分为四大阶段（见图3-1），每个阶段均针对AIGC的核心痛点（如生成质量、效率、模态多样性）提出突破。

timeline
    2017 : 原始Transformer（机器翻译）
    2018 : BERT（双向预训练）
    2019 : GPT-2（自回归生成）
    2020 : ViT（视觉Transformer）、CLIP（多模态）、GPT-3（少样本学习）
    2021 : Swin Transformer（分层视觉）、T5（统一预训练框架）
    2022 : ChatGPT（对话优化）、Stable Diffusion（扩散模型+Transformer）
    2023 : Llama 3（高效微调）、Qwen（多模态指令）、LongNet（长序列处理）

图3-1 Transformer演进时间线

3.1 第一阶段：预训练范式的突破（2018-2020）

传统深度学习需为每个任务标注大量数据，而预训练（Pretraining）通过“大规模无标注数据预训练+小样本微调”大幅降低了AIGC的应用门槛。

3.1.1 BERT：双向预训练的奠基

BERT（2018）首次提出双向掩码语言模型（MLM），解决了GPT（2018）单向预训练无法捕捉上下文的问题。其核心创新：

MLM任务：随机遮盖输入中的15% token（80%替换为[MASK]，10%替换为随机token，10%保留原token），模型预测被遮盖内容；
下一句预测（NSP）：判断两句子是否连续，增强长文本理解能力；
双向表征：通过编码器提取每个token的上下文融合表征（如“苹果”在“吃苹果”和“苹果公司”中表征不同）。

3.1.2 GPT系列：自回归生成的王者

GPT（2018）采用自回归语言模型（AR-LM），通过前向token预测下一个token（ $P(w_1,...,w_n) = \prod_{i=1}^n P(w_i|w_1,...,w_{i-1})$ ），天然适合生成任务。后续GPT-2（2019）引入零样本学习（Zero-shot），GPT-3（2020）通过少样本学习（Few-shot）（仅需示例即可生成），将生成能力提升至新高度。

3.2 第二阶段：专用架构的扩展（2020-2021）

原始Transformer为NLP设计，而计算机视觉（CV）、语音等领域需适配其架构。这一阶段的关键是将自注意力机制迁移到非文本模态。

3.2.1 ViT：视觉Transformer的革命

ViT（2020）首次将Transformer直接应用于图像，其核心步骤：

图像分块（Image Patches）：将224×224的图像分割为16×16的patch（共14×14=196个），每个patch视为一个“视觉token”；
Patch嵌入（Patch Embedding）：通过1×1卷积将每个patch（16×16×3）映射为768维向量；
位置编码：为每个patch添加可学习的位置嵌入；
编码器处理：使用标准Transformer编码器提取全局特征。

ViT证明了自注意力在CV中的有效性，后续Swin Transformer（2021）通过分层注意力（Hierarchical Attention）（局部窗口内计算注意力，降低复杂度），进一步提升了对高分辨率图像的处理能力。

3.2.2 DETR：目标检测的Transformer化

DETR（2020）将目标检测转化为**集合预测（Set Prediction）**问题，通过Transformer直接输出目标边界框与类别。其创新点：

匈牙利匹配（Hungarian Matching）：解决预测框与真实框的匹配问题（最小化匹配损失）；
编码器-解码器架构：编码器提取图像全局特征，解码器生成固定数量（如100个）的目标查询（Object Queries），每个查询对应一个目标。

3.3 第三阶段：多模态融合的爆发（2021-2022）

AIGC的终极目标是生成跨模态内容（如“根据文本描述生成图像”），这要求模型能对齐不同模态的语义空间。

3.3.1 CLIP：跨模态对齐的基石

CLIP（2021）通过**对比学习（Contrastive Learning）**实现文本-图像对齐：

双编码器架构：文本编码器（Transformer）和图像编码器（ResNet/ViT）分别提取特征；
对比损失：对于N对（文本，图像）数据，模型需从N×N的候选对中识别正确配对（ $\mathcal{L} = -\log\left(\frac{\exp(\text{sim}(t_i, i_i)/\tau)}{\sum_j \exp(\text{sim}(t_i, i_j)/\tau)}\right)$ ）；
零样本迁移：预训练后，仅需文本指令即可分类图像（如“一张狗的照片”）。

3.3.2 FLAVA：多模态预训练的统一框架

FLAVA（2022）提出多模态混合训练（Hybrid Training），同时支持单模态（文本/图像）和多模态（文本-图像对）任务，通过共享词表与嵌入层，实现更深度的模态融合。其预训练任务包括：

单模态MLM（文本）与像素掩码（图像）；
多模态匹配（判断文本-图像是否相关）；
跨模态生成（根据文本生成图像描述，或根据图像生成文本）。

3.4 第四阶段：效率优化的突破（2022-至今）

随着模型规模增长（如GPT-3有1750亿参数），训练与推理成本激增。效率优化成为AIGC落地的关键。

3.4.1 稀疏注意力（Sparse Attention）

传统自注意力的时间复杂度为 $O(n^2)$ （n为序列长度），稀疏注意力通过限制每个token仅与部分关键token交互，将复杂度降至 $O (n)$ 或 $O(n\log n)$ 。典型方法包括：

局部窗口注意力（Local Window）：如Swin Transformer，仅计算窗口内token的注意力；
分块注意力（Block Sparse）：将序列分块，块内全连接，块间稀疏连接（如BigBird）；
哈希注意力（Hashing Attention）：通过哈希函数将相似token分组，仅组内计算注意力（如Reformer）。

3.4.2 参数高效微调（Parameter-Efficient Fine-Tuning）

传统微调需更新模型所有参数，而参数高效方法仅调整少量参数（如Adapter、LoRA），大幅降低存储与计算成本。例如：

LoRA（低秩自适应）：在全连接层插入低秩矩阵（秩r远小于原矩阵维度），仅训练低秩矩阵；
Adapter：在每个Transformer层后添加小型前馈网络（如64维），冻结原模型参数。

4. 核心算法原理与数学模型

4.1 自注意力机制：从单头到多头

自注意力是Transformer的核心，其计算流程如下（见图4-1）：

输入向量 $\in \mathbb{R}^{n \times d}$ （n为序列长度，d为嵌入维度）；
通过线性变换生成查询（Q）、键（K）、值（V）矩阵： $Q = XW^Q$ ， $K = XW^K$ ， $V = XW^V$ （ $W^Q, W^K, W^V \in \mathbb{R}^{d \times d_k}$ ）；
计算注意力分数： $\text{scores} = QK^T / \sqrt{d_k}$ （缩放防止梯度消失）；
应用Softmax得到注意力权重： $\text{softmax}(\text{scores})$ ；
加权求和值矩阵： $\text{output} = AV$ 。

$\text{Attention}(Q,K,V) = \text{softmax}\left(\frac{QK^T}{\sqrt{d_k}}\right)V \tag{4-1}$

多头注意力（MHA）将Q、K、V拆分为h个头（ $d_k = d_{\text{model}}/h$ ），并行计算h个自注意力，再拼接结果（见图4-2）：
$\text{MultiHead}(Q,K,V) = \text{Concat}(\text{head}_1,...,\text{head}_h)W^O \tag{4-2}$
其中 $\text{head}_i = \text{Attention}(QW_i^Q, KW_i^K, VW_i^V)$ ， $W^O \in \mathbb{R}^{hd_k \times d_{\text{model}}}$ 。

graph LR
    A[输入X] --> B[Q=XW^Q]
    A --> C[K=XW^K]
    A --> D[V=XW^V]
    B --> E[分数=QK^T/√d_k]
    C --> E
    E --> F[Softmax(分数)]
    D --> G[输出=分数×V]
    F --> G
    G --> H[多头拼接+线性变换]

图4-1 自注意力计算流程

4.2 预训练目标：从MLM到指令微调

4.2.1 掩码语言模型（MLM）

BERT的MLM目标函数为：
$\mathcal{L}_{\text{MLM}} = -\frac{1}{|\mathcal{M}|} \sum_{i \in \mathcal{M}} \log P(x_i | x_{\mathcal{I} \setminus \mathcal{M}}) \tag{4-3}$
其中 $\mathcal{M}$ 是被遮盖的token位置， $\mathcal{I}$ 是所有位置。

4.2.2 自回归语言模型（AR-LM）

GPT的AR-LM目标函数为：
$\mathcal{L}_{\text{AR}} = -\frac{1}{n} \sum_{i=1}^n \log P(x_i | x_1,...,x_{i-1}) \tag{4-4}$

4.2.3 指令微调（Instruction Tuning）

ChatGPT通过**人类反馈强化学习（RLHF）**优化生成质量，其流程：

监督微调（SFT）：用人工标注的对话数据训练初始模型；
奖励模型（RM）训练：标注员对模型生成的多个回答排序，训练奖励模型预测标注偏好；
强化学习优化：用PPO算法（近端策略优化）调整模型，最大化奖励模型评分。

4.3 多模态对齐：对比学习的数学表达

CLIP的对比损失函数（针对N对数据）为：
$\mathcal{L}_{\text{CLIP}} = \mathcal{L}_{\text{text}} + \mathcal{L}_{\text{image}} \tag{4-5}$
其中 $\mathcal{L}_{\text{text}} = -\frac{1}{N} \sum_{i=1}^N \log \frac{\exp(\text{sim}(t_i, i_i)/\tau)}{\sum_j \exp(\text{sim}(t_i, i_j)/\tau)}$ ， $\mathcal{L}_{\text{image}}$ 同理（交换t和i）。
$\text{sim}(t, i) = \frac{t^T i}{\|t\| \|i\|}$ （余弦相似度）， $\tau$ 为温度参数（控制分布尖锐度）。

5. 项目实战：基于Transformer的AIGC生成

5.1 开发环境搭建

硬件要求：NVIDIA GPU（推荐A100/3090，显存≥12GB）；
软件环境：

Python 3.8+；
PyTorch 2.0+（支持CUDA）；
Hugging Face Transformers 4.30+；
其他库：datasets（数据加载）、accelerate（分布式训练）、tokenizers（分词）。

安装命令：

pip install torch transformers datasets accelerate tokenizers

5.2 实战1：文本生成（基于GPT-2）

任务：训练一个生成诗歌的GPT-2模型。

5.2.1 数据预处理

使用“唐宋诗歌”数据集（可从Hugging Face Datasets加载），示例数据：

from datasets import load_dataset
dataset = load_dataset("poem", split="train")

分词与格式化（添加bos_token和eos_token）：

from transformers import GPT2Tokenizer

tokenizer = GPT2Tokenizer.from_pretrained("gpt2")
tokenizer.pad_token = tokenizer.eos_token  # GPT-2无pad_token，用eos替代

def tokenize_function(examples):
    return tokenizer(
        examples["text"],
        padding="max_length",
        truncation=True,
        max_length=128,
        return_tensors="pt"
    )

tokenized_ds = dataset.map(tokenize_function, batched=True)

5.2.2 模型加载与训练

加载GPT-2模型并配置训练参数：

from transformers import GPT2LMHeadModel, TrainingArguments, Trainer

model = GPT2LMHeadModel.from_pretrained("gpt2")

training_args = TrainingArguments(
    output_dir="./gpt2-poem",
    num_train_epochs=3,
    per_device_train_batch_size=4,
    learning_rate=5e-5,
    logging_dir="./logs",
    save_strategy="epoch",
)

trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=tokenized_ds,
)

trainer.train()  # 开始训练

5.2.3 生成诗歌

使用generate()方法生成文本：

prompt = "空山新雨后，"
input_ids = tokenizer(prompt, return_tensors="pt").input_ids.to("cuda")

output = model.generate(
    input_ids,
    max_length=128,
    num_return_sequences=1,
    temperature=0.7,  # 控制随机性（0→确定性，1→随机）
    do_sample=True
)

print(tokenizer.decode(output[0], skip_special_tokens=True))

输出示例：

空山新雨后，天气晚来秋。明月松间照，清泉石上流。竹喧归浣女，莲动下渔舟。随意春芳歇，王孙自可留。

5.3 实战2：图像生成（基于Stable Diffusion）

Stable Diffusion是基于扩散模型（Diffusion Model）的图像生成框架，其文本-图像生成由Transformer（文本编码器）与UNet（图像生成器）协同完成。

5.3.1 模型加载

from diffusers import StableDiffusionPipeline
import torch

pipe = StableDiffusionPipeline.from_pretrained("runwayml/stable-diffusion-v1-5", torch_dtype=torch.float16)
pipe = pipe.to("cuda")

5.3.2 生成图像

prompt = "a beautiful mountain landscape with a lake and sunset"
image = pipe(prompt).images[0]
image.save("mountain_sunset.png")

关键参数：

num_inference_steps：扩散步数（默认50，越大越清晰）；
guidance_scale：引导系数（默认7.5，越大越贴合提示词）；
negative_prompt：负面提示（如“低质量，模糊”）。

6. 实际应用场景

6.1 文本生成：从对话到创作

智能对话：ChatGPT、Claude等通过指令微调，支持多轮对话、代码生成、文本润色；
内容创作：Jasper、Copy.ai用于广告文案、新闻稿、小说生成；
教育辅助：Grammarly生成作文建议，Quizlet生成练习题目。

6.2 图像生成：从设计到艺术

视觉设计：DALL-E 3、MidJourney根据文本生成插画、Logo、产品概念图；
影视制作：Stable Diffusion生成场景背景，减少美术师工作量；
艺术创作：AIGC绘画在拍卖会上拍出高价（如《埃德蒙·贝拉米肖像》）。

6.3 视频生成：从片段到长视频

短视频生成：Pika 1.0支持“文本+参考视频”生成高质量短视频；
电影制作：Runway ML通过视频补全（Video Inpainting）修复老电影，或生成虚拟场景；
教育视频：自动将PPT转换为动画讲解视频（如Synthesia）。

6.4 多模态生成：从理解到交互

多模态对话：GPT-4支持“文本+图像”输入，生成图文并茂的回答；
跨模态翻译：将分子结构（图像）转换为化学公式（文本），或反之；
智能助手：Apple的Siri、Google的Gemini支持语音-文本-图像的多模态交互。

7. 工具和资源推荐

7.1 学习资源推荐

7.1.1 书籍推荐

《Attention Is All You Need: The Story of Transformer》（Jay Alammar）：图解Transformer原理；
《Deep Learning for Natural Language Processing》（Yoav Goldberg）：NLP与Transformer的深度结合；
《Hands-On Machine Learning with Transformers》（Lewis Tunstall等）：实战指南，含代码示例。

7.1.2 在线课程

Coursera《Natural Language Processing Specialization》（DeepLearning.AI）：涵盖Transformer与预训练模型；
Hugging Face Course（https://huggingface.co/learn）：免费交互式课程，含代码练习；
李宏毅《机器学习》（台湾大学）：Transformer与AIGC的中文讲解。

7.1.3 技术博客和网站

Jay Alammar的博客（https://jalammar.github.io/）：Transformer可视化详解；
Hugging Face Blog（https://huggingface.co/blog）：最新模型与技术解读；
arXiv.org：搜索“Transformer”获取前沿论文。

7.2 开发工具框架推荐

7.2.1 IDE和编辑器

PyCharm（专业版）：支持PyTorch调试与代码分析；
VS Code + Jupyter插件：轻量高效，适合交互式开发；
Colab Pro/Pro+：免费/付费GPU资源，适合小规模实验。

7.2.2 调试和性能分析工具

PyTorch Profiler：分析模型训练时间与内存占用；
Weights & Biases（wandb）：实验追踪、超参数调优；
NVIDIA Nsight：GPU性能调试。

7.2.3 相关框架和库

Hugging Face Transformers：最全面的Transformer模型库（支持1000+模型）；
Timm（PyTorch Image Models）：视觉Transformer的预训练模型库；
Diffusers（Hugging Face）：扩散模型库，支持Stable Diffusion等图像生成模型。

7.3 相关论文著作推荐

7.3.1 经典论文

《Attention Is All You Need》（Vaswani等，2017）：原始Transformer；
《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》（Devlin等，2018）；
《An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale》（Dosovitskiy等，2020）；
《Learning Transferable Visual Models From Natural Language Supervision》（Radford等，2021）（CLIP）。

7.3.2 最新研究成果（2023-2024）

《LongNet: Scaling Transformers to 1,000,000 Tokens》（Huang等，2023）：长序列处理的稀疏分块注意力；
《Qwen-VL: A Strong Multimodal Foundation Model》（阿里，2023）：多模态指令微调；
《Llama 3: Open Foundation and Fine-Tuned Chat Models》（Meta，2024）：高效微调与多模态扩展。

7.3.3 应用案例分析

《ChatGPT: Optimizing Language Models for Dialogue》（OpenAI，2022）：RLHF训练细节；
《Stable Diffusion: High-Resolution Image Synthesis with Latent Diffusion Models》（Rombach等，2022）；
《GPT-4 Technical Report》（OpenAI，2023）：多模态能力与评估。

8. 总结：未来发展趋势与挑战

8.1 核心趋势

多模态深度融合：从“对齐”到“互生成”（如根据图像生成3D模型，或根据视频生成文本剧本）；
长序列处理：突破10万+token限制（如LongNet的分块稀疏注意力）；
个性化生成：通过用户画像、历史交互优化生成内容（如定制化教育内容、个性化广告）；
轻量化与边缘部署：通过量化（Quantization）、剪枝（Pruning）实现手机/端侧AIGC应用。

8.2 关键挑战

计算效率：千亿参数模型的训练与推理成本仍过高，需更高效的注意力机制（如Flash Attention）；
生成可控性：如何精确控制生成内容的风格、情感、事实正确性（如避免生成错误信息）；
多模态对齐质量：跨模态语义鸿沟仍存在（如“理解”图像中的抽象概念）；
伦理与安全：生成内容的版权归属、虚假信息传播、深度伪造（Deepfake）等问题需法规与技术协同解决。

9. 附录：常见问题与解答

Q1：Transformer为什么比RNN/CNN更适合AIGC？
A：RNN的序列计算导致并行能力差，长序列梯度消失；CNN的局部感受野难以建模全局依赖。Transformer的自注意力机制支持并行计算与全局交互，天然适合AIGC的长序列生成需求。

Q2：自注意力机制的缺点是什么？如何优化？
A：缺点是时间复杂度 $O(n^2)$ （n为序列长度），对长序列不友好。优化方法包括稀疏注意力（如局部窗口、分块）、近似注意力（如线性注意力）、以及硬件加速（如Flash Attention的内存优化）。

Q3：多模态Transformer的关键挑战是什么？
A：核心是跨模态语义对齐。不同模态的特征空间差异大（如图像的像素空间与文本的词嵌入空间），需设计有效的对齐损失（如CLIP的对比损失）和融合机制（如交叉注意力）。

Q4：如何选择适合的Transformer变种？
A：根据任务类型：

文本生成选GPT系列；
文本理解选BERT/RoBERTa；
图像任务选ViT/Swin Transformer；
多模态选CLIP/FLAVA；
长序列选LongNet/BigBird。

Q5：长文本处理有哪些优化方法？
A：主要方法包括：

稀疏注意力（减少计算量）；
分块处理（将长序列拆分为块，块内全连接，块间稀疏连接）；
位置编码扩展（如相对位置编码支持更长序列）；
模型蒸馏（用小模型模拟大模型的长序列处理能力）。

10. 扩展阅读 & 参考资料

Vaswani, A., et al. (2017). “Attention Is All You Need.” NeurIPS.
Devlin, J., et al. (2018). “BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding.” NAACL.
Brown, T., et al. (2020). “Language Models are Few-Shot Learners.” NeurIPS.
Dosovitskiy, A., et al. (2020). “An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale.” ICLR.
Radford, A., et al. (2021). “Learning Transferable Visual Models From Natural Language Supervision.” ICML.
Huang, Z., et al. (2023). “LongNet: Scaling Transformers to 1,000,000 Tokens.” arXiv.
Hugging Face Documentation: https://huggingface.co/docs
OpenAI Blog: https://openai.com/blog
DeepLearning.AI Courses: https://www.deeplearning.ai/

你可能感兴趣的:(CS,AIGC,transformer,架构,ai)

x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
移动端城市区县二级联动选择功能实现包 good2know
本文还有配套的精品资源，点击获取简介：本项目是一套为移动端设计的jQuery实现方案，用于简化用户在选择城市和区县时的流程。它包括所有必需文件：HTML、JavaScript、CSS及图片资源。通过动态更新下拉菜单选项，实现城市到区县的联动效果，支持数据异步加载。开发者可以轻松集成此功能到移动网站或应用，并可基于需求进行扩展和优化。1.jQuery移动端解决方案概述jQuery技术简介jQuery
（二）SAP Group Reporting (GR) 核心子模块功能及数据流向架构解析
数据如何从子公司流转到合并报表的全过程，即数据采集→合并引擎→报表输出，特别是HANA内存计算如何优化传统ETL瓶颈。SAPGroupReporting(GR)核心模块功能及数据流向的架构解析，涵盖核心组件、数据处理流程和关键集成点，适用于S/4HANA1809+版本：一、核心功能模块概览模块功能关键事务码/FioriApp数据采集(DataCollection)整合子公司财务数据（SAP/非SA
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
深入解析JVM工作原理：从字节码到机器指令的全过程
一、JVM概述Java虚拟机(JVM)是Java平台的核心组件，它实现了Java"一次编写，到处运行"的理念。JVM是一个抽象的计算机器，它有自己的指令集和运行时内存管理机制。JVM的主要职责：加载：读取.class文件并验证其正确性存储：管理内存分配和垃圾回收执行：解释或编译字节码为机器指令安全：提供沙箱环境限制恶意代码二、JVM架构详解JVM由三个主要子系统组成：1.类加载子系统类加载过程分为
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
ARM 和 AMD 架构的区别 m0_69576880 arm开发 windows 架构
ARM架构和AMD架构是两种不同的计算机处理器架构，它们有以下几个主要区别：设计出发点、兼容性、性能特点、市场定价。设计出发点：①ARM构架：ARM架构最初是为嵌入式系统设计的，旨在提供低功耗和高效能的解决方案。它主要应用于移动设备、嵌入式系统和物联网设备②AMD架构：AMD架构是基于x86架构的扩展，旨在提供与Intel架构兼容的处理器。它主要用于台式机、服务器和工作站等计算机系统。兼容性：AR
MotionLCM 部署优化踩坑解决bug AI算法网奇 aigc与数字人深度学习宝典文生motion
目录依赖项windowstorchok：渲染黑白图问题解决：humanml3d：sentence-t5-large下载数据：报错：Nomodulenamed'sentence_transformers'继续报错：fromtransformers.integrationsimportCodeCarbonCallback解决方法：推理相关转mesh：module‘matplotlib.cm‘hasno
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
车载刷写架构 --- 整车刷写中为何增加了ECU 队列刷写策略？汽车电子实验室电子电器架构——刷写方案车载电子电气架构架构开发语言车载诊断进阶篇汽车中央控制单元HPC软件架构关于网关转发性能引起的思考
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：周末洗了一个澡，换了一身衣服，出了门却不知道去哪儿，不知道去找谁，漫无目的走着，大概这就是成年人最深的孤独吧!旧人不知我近况，新人不知我过往，近况不该旧人知，过往不与新人讲。纵你阅人何其多，再无一人恰似我。时间不知不觉中，来到新的一年。2025开始新的忙碌。成年人的我也不知道去哪里渡
车载诊断架构 ---面向售后的DTC应该怎么样填写？汽车电子实验室车载电子电气架构漫谈UDS诊断协议系列 EV（电动汽车）常规知识必备架构面向售后的DTC 车载诊断架构 OEM怎么掌握软件开发能力车载通信网络槪述 android ZEVonUDS-J1979
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：简单，单纯，喜欢独处，独来独往，不易合同频过着接地气的生活，除了生存温饱问题之外，没有什么过多的欲望，表面看起来很高冷，内心热情，如果你身边有这样灵性的人，一定要好好珍惜他们眼中有神有光，干净，给人感觉很舒服，有超强的感知能力有形的无形的感知力很强，能感知人的内心变化喜欢独处，好静，
车载诊断架构 --- 关于诊断时间参数P4的浅析汽车电子实验室车载电子电气架构漫谈UDS诊断协议系列架构开发语言关于网关转发性能引起的思考汽车中央控制单元HPC软件架构车载诊断进阶篇
关于诊断时间参数P4的浅析我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：所谓鸡汤，要么蛊惑你认命，要么怂恿你拼命，但都是回避问题的根源，以现象替代逻辑，以情绪代替思考，把消极接受现实的懦弱，伪装成乐观面对不幸的豁达，往不幸上面喷“香水”来掩盖问题。无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事.而不是让内心的烦
车载刷写架构 --- 刷写思考扩展汽车电子实验室电子电器架构——刷写方案架构开发语言关于网关转发性能引起的思考汽车中央控制单元HPC软件架构车载诊断进阶篇
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：做到欲望极简，了解自己的真实欲望，不受外在潮流的影响，不盲从，不跟风。把自己的精力全部用在自己。一是去掉多余，凡事找规律，基础是诚信；二是系统思考、大胆设计、小心求证；三是“一张纸制度”，也就是无论多么复杂的工作内容，要在一张纸上描述清楚；四是要坚决反对虎头蛇尾，反对繁文缛节，反对老
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
基于redis的Zset实现作者的轻量级排名周童學 Java redis 数据库缓存
基于redis的Zset实现轻量级作者排名系统在今天的技术架构中，Redis是一种广泛使用的内存数据存储系统，尤其在需要高效检索和排序的场景中表现优异。在本篇博客中，我们将深入探讨如何使用Redis的有序集合（ZSet）构建一个高效的笔记排行榜系统，并提供相关代码示例和详细的解析。1.功能背景与需求假设我们有一个笔记分享平台，用户可以发布各种笔记，系统需要根据用户发布的笔记数量来生成一个实时更新的
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
js操作样式郝加升
DOM样式属性和方法：指定的元素，它的style有这么几个属性和方法：cssText：通过这个属性可以访问到元素的特性style设置的属性，并且可以直接赋值设置。removeProperty（属性名称）：从样式中删除给定属性。setProperty（属性名称，值，权重）：可以通过这个方法设置给定样式的同时设置其权重，可以传入”important”或者一个空字符串。获取计算后样式：window.ge
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
Redis + Caffeine 实现高效的两级缓存架构周童學 Java 缓存 redis 架构
Redis+Caffeine实现高效的两级缓存架构引言在现代高并发系统中，缓存是提升系统性能的关键组件之一。传统的单一缓存方案往往难以同时满足高性能和高可用性的需求。本文将介绍如何结合Redis和Caffeine构建一个高效的两级缓存系统，并通过三个版本的演进展示如何逐步优化代码结构。项目源代码：github地址、gitee地址两级缓存架构概述两级缓存通常由本地缓存（如Caffeine）和分布式缓
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
严重的DDoS 攻击澳大利亚主要宽带提供商 Fancy1816575412
本周早些时候，澳大利亚最大的固定无线宽带运营商CirrusCommunications遭受了一次重大的DDoS攻击，导致其一半以上的网络瘫痪。该公司在其网站上声称：“强大的架构、数百个传输站点以及光纤和微波回程的使用使其能够以非常高的正常运行时间提供高速”。CirrusCommunications表示，它覆盖了澳大利亚十大人口中心以及几个主要的区域中心，主要为企业和政府客户提供服务。然而，据The
Selenium 特殊控件操作与 ActionChains 实践详解小馋喵知识杂货铺 selenium 测试工具
1.下拉框单选操作(a)使用SeleniumSelect类（标准HTML标签）Selenium提供了内置的Select类用于操作标准下拉框，这种方式简单且直观。fromselenium.webdriver.support.uiimportSelect#定位下拉框dropdown=Select(driver.find_element("id","dropdown_id"))#通过以下三种方式选择单个
深入理解 Tomcat Wrapper 原理北漂老男人 Tomcat tomcat java
深入理解TomcatWrapper原理一、引言在Tomcat的分层容器架构中，Wrapper作为最底层的容器，专门负责管理单个Servlet的生命周期及请求分发。每一个Servlet（包括JSP、Filter等）都对应一个Wrapper。Wrapper是Servlet规范与Tomcat容器实现之间的桥梁，直接关系到请求的分发效率、Servlet的加载与重用、安全隔离等。本文将系统剖析Wrapper
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情