kuokay

大模型微调综述

大模型微调技术详解

前言
什么是大模型微调
为什么需要大模型微调
- 大模型技术演进全景图
- - 阶段对比速查表
微调分类及特点
- 指令微调(Instruction Fine-Tuning，IFT)
- 全参数微调(Full Fine Tuning，FFT)
- 参数高效微调（Parameter-Efficient Fine-Tuning，PEFT）
常见的微调技术
- LoRA（Low-Rank Adaptation）
- QLoRA（Quantized Low-Rank Adaptation）
- 适配器调整（Adapter Tuning）
- 前缀调整（Prefix Tuning）
- 提示调整（Prompt Tuning）
- P-Tuning
- P-Tuning v2
- 插件式指令微调PILL（Pluggable Instruction Language Learning）
- SSF（Scaling & Shifting Your Features）微调
- 微调方法对比
- 技术选型矩阵

前言

随着大型语言模型(Large Language Models, LLMs)的快速发展，如何让这些通用模型更好地适应特定场景和任务，已成为AI领域的热点问题。大模型微调技术应运而生，成为连接通用大模型与专业应用的桥梁。本文将系统介绍大模型微调的概念、必要性、分类及常见技术方法。

什么是大模型微调

大模型微调(Fine-tuning)是指在预训练大模型（如 GPT、LLaMA 等）的基础上，使用特定领域或任务的数据进行二次训练，使模型更好地适应特定应用场景的过程。通过微调，可以在保留模型原有通用知识的基础上，增强其在特定领域的表现能力。

微调过程实质上是一种知识迁移，将预训练阶段获得的通用语言理解能力，转化为解决特定问题的能力。与从零开始训练相比，微调利用了预训练模型中已有的知识结构，大大提高了训练效率并降低了资源需求。

为什么需要大模型微调

弥补通用模型的不足
- 领域专业化：预训练模型虽具有广泛的通用知识，但在特定专业领域（如医疗、法律、金融等）的知识深度不足，微调可以增强模型在这些专业领域的表现。
  任务针对性：通用模型在特定任务上的表现可能次优，如摘要生成、情感分析等，微调可以显著提升模型在特定任务上的性能。
解决资源与成本问题
- 降低计算成本：从头训练大模型需要巨大的计算资源，而微调只需要较少的计算资源即可完成。
  减少数据需求：微调只需要相对较少的领域数据，而非亿级别的预训练数据集。
改善模型行为
- 减少幻觉：微调可以减少模型产生虚假内容的倾向，提高输出的准确性和可靠性。
- 安全合规：通过微调可以使模型的输出更符合安全、道德和法律要求。
- 定制化输出：可以调整模型的输出风格、格式和内容，以满足特定应用需求。

大模型技术演进全景图

预训练（Pretraining）——积累广泛知识
- 在训练初期，模型的主要目标是大量摄取和存储知识，就像一个初学者在图书馆里狂读各种书籍。这个阶段的核心任务是让模型暴露于大规模的文本数据，如百科全书、新闻报道、书籍等。通过分析这些数据，模型能够学习语言的基本结构、语法、词义关联等。
- 这个阶段通常采用无监督学习，也就是说，模型主要依赖于统计规律和模式匹配来理解文本，而不会有人工标注的数据进行额外指导。例如，如果我们输入“牛顿发现了”，模型可能会自动补全为“万有引力定律”。预训练让模型掌握了语言的表达方式，但此时的模型并不具备真正的交互能力，只能基于概率预测下一个词的出现。
- 输入：全网文本（书籍/网页/代码等）
- 过程：无差别吸收所有可见信息
- 成果：
  - 掌握语言规则（语法/句式）
  - 建立知识图谱（事实/概念）
  - 形成基础逻辑能力
监督微调（Supervised Fine-Tuning, SFT）——学会对话和任务执行
- 虽然预训练赋予了模型丰富的知识储备，但此时的模型仍然像一本百科全书，可以回答问题，但缺乏连贯性和对话逻辑。在**监督微调（SFT）**阶段，模型需要学习如何按照人类的期望组织语言、回答问题，并适应不同的任务。
- 这个过程涉及人工标注的高质量数据集，通常是以“指令+示例答案”的形式提供。例如，我们可以提供这样的训练样本：
- 输入：请给出关于牛顿第一定律的解释
- 理想输出：牛顿第一定律，又称惯性定律，表明物体如果不受外力作用，将保持其静止或匀速直线运动状态。
- 经过监督训练后，模型不仅学会了按照特定的格式回答问题，还能在对话中体现更自然的交流方式。SFT 也常被称为指令微调（Instruction Tuning），因为它让模型能够按照人类指令更准确地回应。
- 输入：人工标注的对话数据
- 调教重点：
  - 理解人类指令（“总结下文” vs “扩写文本”）
  - 规范输出格式（段落结构/标点使用）
  - 控制语言风格（正式/口语化）
- 典型表现：
  - 从"知识书呆子"变成"能对话的助手"
强化学习优化（Reinforcement Learning from Human Feedback, RLHF）——优化交互体验
- 尽管监督微调让模型具备了基本的对话能力，但仍然无法保证其回答一定符合人类的预期。比如，模型可能生成冒犯性内容，或者回答并不符合用户的偏好。因此，在**强化学习优化（RLHF）**阶段，我们要通过人类反馈，让模型不断调整自己的行为，使其更符合人类的需求。
- 这个过程可以类比为一个新员工进入公司后，接受上级和客户的反馈，不断修正自己的沟通方式。具体而言，RLHF 的流程包括：
1. 收集反馈数据：让人类标注者对不同回答的优劣进行评分。
2. 训练奖励模型：基于人类反馈训练一个评分系统，判断哪些回答更受欢迎。
3. 强化学习更新：用这个奖励模型来优化大语言模型，使其倾向于生成更优质的回答。
- RLHF 主要用于提升模型的安全性、礼貌性和用户体验，但它并不会提升模型的知识深度或逻辑推理能力。此外，RLHF 依赖于人工反馈，数据收集成本较高，并可能受到偏见的影响。
- 训练机制：人类偏好投票系统
- 优化方向：
  - 安全性：过滤有害/偏见内容
  - 价值观：符合伦理道德标准
  - 实用性：提升回答有帮助性
- 成果体现：
  - 从"口无遮拦"变得"知分寸懂进退"
领域适配微调（Fine-Tuning, FT）——让模型专注于特定业务
- 在完成上述训练后，模型已经具有较强的语言理解能力和交互体验，但它仍然是一个“通用型”选手，并没有针对某个领域进行优化。领域适配微调（Fine-Tuning, FT）就是让模型在特定的业务场景中表现更专业，例如法律、医学、金融等领域。
- 在此阶段，通常会使用特定行业的数据集对模型进行训练。例如，针对法律咨询的 AI，训练数据可能包含大量的法律判例、法规条文及专业的法律解读。通过这样的微调，模型可以更准确地理解和生成符合行业标准的回答。
- 典型场景：
  
  微调
  
  医疗问诊
  
  合同审查
  
  代码生成

阶段对比速查表

微调分类及特点

指令微调(Instruction Fine-Tuning，IFT)

原理：使用高质量的任务指令数据，通过优化输入的指令（prompt）来引导模型的行为，使其适应不同的任务需求。

特点：

依赖大规模、高质量的任务指令数据。
适用于多任务学习，能够提升模型对不同任务的泛化能力。
不改变模型参数，仅通过优化指令进行调整。

缺点：

需要高质量的指令数据集。
在某些特定任务上效果可能不如全参数微调。

全参数微调(Full Fine Tuning，FFT)

原理：调整整个模型的所有参数，使其适应特定任务。

特点：

能够获得最优的任务适配性和性能。
适用于数据量充足、计算资源充裕的场景。
适用于长期部署的专用模型。

缺点：

计算资源消耗大，对存储和训练硬件要求高。
可能导致模型的灾难性遗忘（Catastrophic Forgetting）。

参数高效微调（Parameter-Efficient Fine-Tuning，PEFT）

原理：只调整部分参数（如低秩矩阵、适配器层等），降低计算开销，同时保持模型的原始能力。

特点：

计算成本较低，适用于资源受限环境。
适用于多任务场景，灵活性高。
通过少量可训练参数实现模型微调。

缺点：

可能损失一定的模型泛化能力。
需要针对不同任务选择合适的参数高效微调方法。

常见的微调技术

LoRA（Low-Rank Adaptation）

原理：

LoRA基于这样一个假设：模型适应过程中的参数更新矩阵往往是低秩的。因此，可以用两个小矩阵的乘积来近似权重更新，大幅减少可训练参数数量。

核心：

为原模型的权重矩阵W添加一个低秩分解矩阵ΔW=BA，其中B和A分别是低秩矩阵，秩r远小于原矩阵维度。

实现关键步骤：

冻结预训练模型的原始权重
为每个需要微调的权重矩阵W添加低秩矩阵对B和A
仅训练这些低秩矩阵
推理时将ΔW与原始权重W相加

QLoRA（Quantized Low-Rank Adaptation）

原理：

QLoRA结合了模型量化和LoRA技术，通过量化预训练权重来节省内存，同时使用LoRA进行参数高效微调。

核心：

将原始模型量化为4比特精度，同时使用LoRA进行微调，并采用分页优化等技术减少内存使用。

实现关键步骤：

将预训练模型量化至4比特
应用LoRA技术添加可训练的低秩参数
使用NF4（Normal Float 4）量化方案
采用双重量化技术进一步节省内存
使用分页优化技术处理激活值

适配器调整（Adapter Tuning）

原理：

在原始模型层之间插入小型可训练模块（适配器），原模型参数保持不变，只训练这些新增的适配器模块。

核心：

适配器通常由降维层、非线性激活函数和升维层组成，形成"瓶颈"结构，大幅减少参数量。

实现关键步骤：

冻结预训练模型的所有参数
在Transformer层后添加适配器模块
适配器内部包含降维层和升维层
仅训练适配器模块的参数
添加残差连接以稳定训练

前缀调整（Prefix Tuning）

原理：

在模型输入序列的前面添加一组可训练的连续向量（前缀），这些向量可以引导模型生成特定风格或领域的内容。

核心：

为模型的每一层添加可训练的前缀向量，这些向量在序列长度维度上扩展了注意力机制的上下文。

实现关键步骤：

在每层自注意力机制的K和V矩阵前添加可训练的前缀向量
冻结预训练模型的参数
仅训练这些前缀向量
使用参数化网络生成前缀，以提高稳定性

提示调整（Prompt Tuning）

原理：

在输入嵌入层添加一组可学习的软提示向量，这些向量会与输入序列一起传入模型，引导模型行为。

核心：

只在输入层添加可训练的连续向量，而不是在每一层都添加，简化了前缀调整方法。

实现关键步骤：

在输入嵌入序列前添加一组可训练的向量（软提示）
冻结原始模型参数
只训练这组软提示向量
通过反向传播优化软提示向量

P-Tuning

原理：

在输入层添加少量可训练的伪标记（pseudo tokens），通过一个小型神经网络将这些标记转换为嵌入表示。

核心：

使用双向LSTM处理伪标记，生成上下文相关的连续提示表示。

实现关键步骤：

添加少量可训练的伪标记
使用双向LSTM处理这些伪标记
将处理后的表示作为模型输入
只训练伪标记和LSTM参数

P-Tuning v2

原理：

扩展了P-Tuning，将可训练的提示向量应用到模型的每一层，而不仅是输入层。

核心：

将深度可学习的连续提示应用于模型的所有层，像Prefix Tuning一样，但结构更简单高效。

实现关键步骤：

在每层自注意力机制中添加可训练的提示向量
冻结原始模型参数
使用简单的结构，无需参数化网络
优化所有层的提示向量

插件式指令微调PILL（Pluggable Instruction Language Learning）

原理：

将指令理解能力模块化为可插拔组件，在保持原模型功能的同时增强模型对指令的理解和执行能力。

核心：

构建独立的指令理解模块，在不影响原始模型的情况下，增强模型对指令的处理能力。

实现关键步骤：

设计专门的指令处理模块
将该模块与原模型集成但保持结构独立
使用指令数据集训练该模块
实现模块的即插即用，便于在不同模型间迁移

SSF（Scaling & Shifting Your Features）微调

原理：

通过缩放和平移特征表示来调整模型行为，而不是直接修改原始权重。

核心：

为模型每层的特征表示添加可训练的缩放和平移参数，类似于批归一化的思想。

实现关键步骤：

为每层特征添加缩放因子和平移因子
冻结原始模型参数
仅训练这些缩放和平移参数
根据公式：y = αx + β调整特征表示

微调方法对比

方法	参数效率	计算开销	存储开销	适用场景	优点缺点
LoRA	高	中	低	通用任务、大模型微调	参数量少(0.1%-1%)、性能接近全量微调、实现简单
QLoRA	极高	低	极低	资源受限环境、超大模型微调	显著减少内存使用、支持消费级GPU微调大模型
适配器调整	高	中	低	多任务学习、模型复用	模块化设计、易于任务切换、稳定性好
前缀调整	高	中	低	文本生成任务、风格转换	特别适合生成任务、可控性强训练不稳定、需要较多前缀长度才能达到好效果
提示调整	极高	低	极低	简单任务、快速适应	参数量极少、实现简单、迁移方便
P-Tuning	极高	低	极低	NLU任务、模板优化	参数量极少、针对性强
P-Tuning v2	高	中	低	NLU和NLG任务	综合了Prefix-Tuning和P-Tuning优点、性能更好
PILL	高	中	低	指令遵循、多任务	模块化设计、可迁移性强、指令理解能力突出
SSF	极高	低	极低	风格调整、简单适应	实现极其简单、参数量极少、稳定性好

技术选型矩阵

根据应用场景的快速决策指南：

场景特征	推荐方法	理由
显存<24GB	QLoRA + SSF	4-bit量化+特征缩放双重优化
多任务部署	Adapter	模块化架构支持并行任务
实时推理要求	LoRA	无额外计算开销
跨模态迁移	SSF	特征分布适配效果显著
复杂指令响应	PILL + P-Tuning v2	深度提示+指令模板协同

男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
9、汇编语言编程入门：从环境搭建到简单程序实现神经网络酱汇编语言 MEPIS GNU工具链
汇编语言编程入门：从环境搭建到简单程序实现1.数据存储介质问题解决在处理数据存储时，若要使用MEPIS系统，需确保有其可访问的存储介质。目前，MEPIS无法向采用NTFS格式（常用于Windows2000和XP工作站）的硬盘写入数据。不过，若硬盘采用FAT32格式，MEPIS就能进行写入操作。此外，MEPIS还能将文件写入软盘和大多数USB闪存驱动器。若工作站连接到局域网，还可通过FTP协议或挂载
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
SpringMVC的执行流程
1、什么是MVCMVC是一种设计模式。MVC的原理图如下所示M-Model模型（完成业务逻辑：有javaBean构成，service+dao+entity）V-View视图（做界面的展示jsp，html……）C-Controller控制器（接收请求—>调用模型—>根据结果派发页面2、SpringMVC是什么SpringMVC是一个MVC的开源框架，SpringMVC=Struts2+Spring，
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
最新阿里四面面试真题46道：面试技巧+核心问题+面试心得风平浪静如码
前言做技术的有一种资历，叫做通过了阿里的面试。这些阿里Java相关问题，都是之前通过不断优秀人才的铺垫总结的，先自己弄懂了再去阿里面试，不然就是去丢脸，被虐。希望对大家帮助，祝面试成功，有个更好的职业规划。一，阿里常见技术面1、微信红包怎么实现。2、海量数据分析。3、测试职位问的线程安全和非线程安全。4、HTTP2.0、thrift。5、面试电话沟通可能先让自我介绍。6、分布式事务一致性。7、ni
今晚吃太饱了爱伤心的蚂蚁
今晚吃太饱了，两碗干饭，两碗肉汤，一碗牛奶银耳汤，感觉肚子都顶出来了，圆滚滚的！明早要早起，出发去小蚂蚁家！看着剩下的肉汤，倒掉多可惜，干掉了！看着小蚂蚁熬的银耳汤，倒掉多可惜，于是热了一下，顺便热袋牛奶倒进去，大娃喝点，小蚂蚁喝点，还剩下一大碗，继续干掉！吃的太饱，人也懒洋洋的，躺床上不想动，感受的肚子撑撑的感觉，好久没吃这么饱了！这一晚灌的都是汤汤水水的，天冷的晚上，半夜要睡不安稳咯！哈哈！小
你对待万事万物的态度行靜
昨晚爸爸把洒水壶灌满水，对我说：你也该去浇浇你阳台上的花咯。这么大的天气，几天没浇水都快死了。我才意识到自己容易突然间忽视一些事情。尤其是身旁的一些事，可能它们呆久了，反而习以为常。想想每天的生活状态就是在不断的重复着一些事，有点固定模式。没有什么特别发生。记录我的一天：上班，挤公交，用手机或电脑，吃饭，上课。没有
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
承德十大亲子鉴定医院名单(附2024年10所正规医院) 国医基因陈主任
承德哪家医院可以做亲子鉴定？承德市中心医院、中国人民解放军第二六六医院、承德医学院附属医院等都可以做常规亲子鉴定采样采集，一般的医院并不可以为你提供常规亲子鉴定检测的服务。承德亲子鉴定中心地址：承德市西大街路北11号（承德国医基因）。一般只有少数三甲医院可以做亲子鉴定采样，或者当地亲子鉴定中心可以做亲子鉴定。如果想做亲子鉴定，最好直接到亲子鉴定中心内或亲子鉴定医院采样点内进行双方抽血鉴定，这样会更
践行8.0~第六周11.25-12.02 初队长
突破后的喜悦最可怕的不是自己不清楚，而是自己清楚了，却依然不心动，我想这就是我们每个人的惰性存在，在这一周的践行，我发现自己依然是停留在自己的模式当中，不断的恶性的轮回，虽然的话，那再晨间日记方面是纸质的填写，但是对一天的工作没有起到应有的计划和推动的作用而我自己呢，也有些时候的话会处于一个相对来讲放松的一个状态，时间的把控的话也有一些点的消极，所以在这周的间隙，重点是关注自己的三大目标为目标来进
5G基站信号加速器！AD8021ARZ-REEL7亚德诺超低噪声高速电压放大器专利失真消除技术! 深圳市尚想信息技术有限公司 5G通信高速运放 ADI黑科技 8K视频医疗超声
AD8021ARZ-REEL7ADI：重新定义高速放大器的性能极限！一、产品简介AD8021ARZ-REEL7是ADI（亚德诺半导体）推出的超低噪声高速电压反馈放大器，采用XFCB工艺和专利失真消除技术，专为4K/8K视频处理、医疗成像、5G通信等超高频应用设计。以1.8GHz带宽和0.1nV/√Hz超低噪声，成为高速信号调理的终极解决方案！二、五大颠覆性优势军工级信号保真度1.8GHz-3dB带
打造自己的梦想生态系统轻风style
今天听了第5周5.1的梦想系统和随堂练习：梦想仓库与八大关注表。参照老师给出的例子，列出了八大关注对应的自己的梦想。有些写的时候内心都在怀疑，但因为老师有说到，要没有分别心的去列出，不管是近的，远的，小的，大的，自己觉得可以实现的，或者觉得根本不可能实现的，都统统的列出来。就像音频中提到的，林语堂说过的话，梦想无论怎样模糊，总潜伏在我们心底，使我们的心境永远得不到宁静，直到这些梦想成为事实才止；像
我是孩子妈妈，我会让孩子饿着吗？松玲子
回老家过年，就是一场在关于喂养孩子问题上与老人的巅峰对决。前天我们回老家了，他爷爷奶奶就说孩子瘦了，就说我喂的不好，不按时喂，第一天夜里孩子总是睡一会就哭，睡一会就哭，夜里不知醒了多少次，弄得我真是几乎彻夜未眠。一大早，我还没起，我就听见他爷爷奶奶在外边说，今黑夜阳阳怎么老哭，是不是饿的，然后又延伸到我喂养的问题上，说不吃盐不行，不吃盐孩子没劲，吃蛋光吃个蛋黄，吃不饱，给他吃全蛋就行，哎呀我去，我
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
京东中秋节会打折吗？京东中秋节活动力度大吗？高省APP珊珊
京东中秋节会打折，并且活动力度通常是比较大的。以下是具体分析：京东中秋节打折情况降价促销：京东在中秋节期间会推出大规模的降价促销活动，涵盖食品、家居、家电等多个品类，以及众多热门品牌。消费者可以在此期间享受到实实在在的降价优惠。多种优惠形式：除了直接的降价促销，京东还会通过满减优惠、折扣促销、限时秒杀等多种形式的优惠活动来吸引消费者。这些优惠活动通常具有较高的吸引力，能够激发消费者的购买欲望。目前
Android 应用权限管理详解
文章目录1.权限类型2.权限请求机制3.权限组和分级4.权限管理的演进5.权限监控和SELinux强制访问控制6.应用权限审核和GooglePlayProtect7.开发者最佳实践8.用户权限管理9.Android应用沙箱模型10.ScopedStorage（分区存储）11.背景位置权限（BackgroundLocationAccess）12.权限回收和自动清理13.权限请求的用户体验设计14.G
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
农场种蔬菜赚钱小游戏有哪些五大可以赚钱的小游戏APP 氧惠帮朋友一起省
喜欢种菜吗？我特意带来农场种蔬菜赚钱小游戏排行榜2022，线上汇集了超多模拟种菜玩法，玩家可以免费种植赚钱哦！每天都有大量的种植任务，线上完成就能赚钱哦！快来下载吧！1.氧惠APP购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多少，非常厉害)，欢迎各位
严重的DDoS 攻击澳大利亚主要宽带提供商 Fancy1816575412
本周早些时候，澳大利亚最大的固定无线宽带运营商CirrusCommunications遭受了一次重大的DDoS攻击，导致其一半以上的网络瘫痪。该公司在其网站上声称：“强大的架构、数百个传输站点以及光纤和微波回程的使用使其能够以非常高的正常运行时间提供高速”。CirrusCommunications表示，它覆盖了澳大利亚十大人口中心以及几个主要的区域中心，主要为企业和政府客户提供服务。然而，据The
mysql复习立夏的李子 mysql 数据库 database
mysqlselect语法selectfromjoinwheregroupbyhavingorderbylimit联合查询innerjoin（）leftjoin（以左表为基准，匹配右表，不匹配的返回左表，右表以null值填充）rightjoind··(去除列重复的数据)索引类型主键索引(PrimaryKey)唯一索引(Unique)常规索引(Index)全文索引(FullText)索引准则索引不是
3次创业身价百亿，2年前却被大众判“死刑”，李想如今怎样了？职心眼儿
他，19岁放弃高考去创业；25岁，成为亿万富豪，被央视评为“80后创业”领军人物；39岁，身价再次暴涨，一夜间闯过200亿大关。他，在3个领域连续创业20年，一家公司市值700亿，一家公司市值2000亿。而他的最高学历，却只有高中。这个人，就是理想汽车的创始人——李想。纵观李想的创业史，可谓是颇为传奇：一个既没背景，又没资金高中毕业生，怎么就让3位互联网巨头（张一鸣、王兴、程维）同时为自己站台？更
【备孕故事】她一直想做个大差不离的人，没想到在这件事上拔了尖儿宜嘉阿姨
图片发自App杨婷说从小到大自己就是个中规中矩的人，不出格，不落单，一直随着大流。学业上从未出类拔萃，却也跟着大部队一起考上了一本；做事从不冒尖，搞个大差不离就行，因此，这么多年以来，差不多就行成了她对自己人生的要求。22岁大学毕业进了一家国企，外型不出挑但文静可人的她也遇上了两位追求者，简单的观察和交往后，她从中选了李广作为自己的婚恋对象。25岁那年，在父母亲朋的祝福声中杨婷和李广步入了婚姻。婚
黛玉葬花是一种什么心情爱的生命力
图片发自App小区里的花终于开了，带着孩子在小区散步的时候，无意间我注意到了玉兰，第一次我发现原来它是先开花后长叶子的，洁白如玉的花高耸入云，那种洁白，让人敬畏。因为有风，所以带孩子在楼遮挡的草坪上玩，发现紫叶李的花也开了，并且随着风的吹动，落了满地，孩子捡起一朵花，拿到我面前，细声细气的说“花”，我的大脑细胞瞬间激活，为什么不和孩子一起捡花呢！这可是一项好玩的游戏，于是我给孩子拿了一个大的挖土用
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。

大模型微调综述

大模型微调技术详解

前言

什么是大模型微调

为什么需要大模型微调

大模型技术演进全景图

阶段对比速查表

微调分类及特点

指令微调(Instruction Fine-Tuning，IFT)

全参数微调(Full Fine Tuning，FFT)

参数高效微调（Parameter-Efficient Fine-Tuning，PEFT）

常见的微调技术

LoRA（Low-Rank Adaptation）

QLoRA（Quantized Low-Rank Adaptation）

适配器调整（Adapter Tuning）

前缀调整（Prefix Tuning）

提示调整（Prompt Tuning）

P-Tuning

P-Tuning v2

插件式指令微调PILL（Pluggable Instruction Language Learning）

SSF（Scaling & Shifting Your Features）微调

微调方法对比

技术选型矩阵

你可能感兴趣的:(人工智能,大模型微调,Lora,RLHF,SFT,FT)