艾醒(AiXing-w)

探索大语言模型（LLM）：查漏补缺，你真的完全了解大语言模型的术语吗？

前言

在人工智能领域，大语言模型（LLM）已成为技术革新与应用落地的核心驱动力。从参数规模到训练技术，从基础架构到前沿研究方向，理解这些术语是掌握LLM技术的关键。本文将系统解析大语言模型的核心术语，涵盖模型规模、训练方法、优化技术、部署实践及前沿研究方向，为从业者构建完整的知识结构。

一、模型规模与参数术语

32B/72B中的"B"

"B"代表Billion（十亿），指模型参数量。例如：

Qwen1.5-32B： 320亿参数，阿里云开源模型，在中文处理能力上超越GPT-4。
DeepSeek-R1-32B： 320亿参数，支持4-bit量化（Q4），显存占用降至20GB。
参数意义： 参数量决定模型容量，更多参数可捕捉更复杂的语言模式，但训练成本指数级增长。

Scaling Law（缩放定律）

学术定义： 描述模型性能与参数量、数据量、计算资源的关系。研究表明，性能提升遵循幂律关系，但边际效益递减。
通俗解释： 想象你正在学习骑自行车。最初，每多练习一次（相当于增加参数量），你的骑行技巧都会显著提升。但随着练习次数的增加，提升的幅度会逐渐变小，直到你几乎无法再通过更多的练习来显著提高技巧。这就是“缩放定律”在日常生活中的一个类比：在模型训练中，随着参数量、数据量或计算资源的增加，模型性能会提升，但提升的速度会逐渐放缓。

混合专家模型（MoE）

定义： 由多个专业化的子模型（即“专家”）组合而成，每个“专家”在其擅长领域内做出贡献。门控网络决定哪个专家处理特定任务。
DeepSeek-R1的MoE架构： 采用6710亿参数规模，但每个token仅激活370亿参数，通过稀疏门控机制实现高效计算。
Qwen3的MoE架构： 旗舰模型Qwen3-235B-A22B总参数量2350亿，激活参数量仅220亿，支持动态稀疏计算，显著降低部署成本。
优势： 兼顾性能与效率，例如Qwen3-235B-A22B在代码、数学等基准测试中表现与DeepSeek-R1、OpenAI o1相当。

二、模型类型与训练技术

基座模型（Foundation Model）

大规模预训练模型（如DeepSeek V3），通过无监督学习掌握通用语言规律与知识，作为下游任务的基础。

推理模型（Reasoning Model）

通过技术增强逻辑能力：

思维链（Chain-of-Thought, CoT）：要求模型输出中间推理步骤（如"Let’s think step by
step"），提升复杂任务表现。
上下文学习（In-context
Learning）：通过少量示例（Zero-shot/Few-shot）快速适应新任务。

指令微调模型（Instruction-Tuned Model）

在基座模型上用（指令, 输出）对微调，提升对人类指令的遵循能力。例如：

监督微调（SFT）： 使用标注数据优化模型，与指令微调的区别在于数据结构和目标（任务适配 vs 指令遵循）。
RLHF（人类反馈强化学习）： 通过人类评分优化模型输出，如ChatGPT。

三、训练与优化技术

预训练（Pre-training）

在大规模无标注数据上学习通用语言规律，如Transformer架构通过自注意力机制捕捉长距离依赖。这一步模型厂商已经做好了，如果使用开源模型，不需要做这一步。

微调（Fine-tuning）

全量微调： 更新所有参数，需大量计算资源。
高效微调： 仅更新部分参数（如LoRA），降低资源消耗。

量化（Quantization）

定义： 将模型中的浮点数权重和激活值减少到较低的精度，以减少内存占用和计算需求。
常用量化精度：
- BF16 (Bfloat16)： 16位浮点数，保持与FP32相同的动态范围，适用于训练。
- FP16 (16-bit Floating Point)： 半精度浮点数，提高计算速度，适用于推理。
- INT8 (8-bit Integer)： 将32位浮点数转换为8位整数，平衡精度与计算效率。
- INT4 (4-bit Integer)： 进一步压缩模型，但可能导致显著精度损失。(一般不推荐)
量化影响：
- 推理速度提升： 使用整数运算代替浮点运算，显著提高推理速度。
- 显存占用减少： 例如，DeepSeek-R1-32B通过INT8量化，显存占用降低65%。
- 精度损失： 极端量化（如INT4）可能导致模型性能下降，需通过校准技术缓解。
量化策略：
- 后训练量化（PTQ）： 训练后量化，简单直接但可能损失精度。
- 量化感知训练（QAT）： 训练过程中模拟量化影响，保持较高精度。
- 动态量化： 推理时动态调整量化参数，适应不同输入分布。

四、大模型应用术语

提示词工程（Prompt Engineering）

定义： 通过设计高质量的输入指令（Prompt），引导大语言模型生成符合预期输出的技术。
核心原则：
- 清晰性： 明确任务目标（如“用50字总结新闻要点”）。
- 具体性： 提供上下文（如“作为历史老师，解释工业革命的影响”）。
- 结构化： 使用分隔符、步骤提示（如“首先…其次…最后…”）。
高级技巧：
- 思维链（Chain-of-Thought）： 要求模型逐步推理（如“请列出计算步骤”）。
- 少样本学习（Few-shot Learning）： 提供示例（如“示例：苹果→水果；汽车→？”）。
- 角色扮演： 指定模型身份（如“你是一名律师，分析合同条款”）。
工具支持：
- Prompt优化工具： 如PromptPerfect、AI Prompt Generator，辅助生成高质量提示词。
应用场景：
- 内容创作： 通过精准提示生成特定风格的文案。
- 数据分析： 引导模型按指定格式输出分析结果。
- 教育辅导： 设计互动式问题，提升学习效果。

知识库应用（Knowledge Base Application）

定义： 结合大语言模型与外部知识库（如文档、数据库、API），提供精准、实时信息的技术架构。
实现方式：
- 检索增强生成（RAG）：
  1. 检索：根据用户查询，从知识库中检索相关文档。
  2. 生成：将检索结果作为上下文输入模型，生成回答。
- 微调（Fine-tuning）： 使用知识库数据对模型进行定制化训练。
核心优势：
- 减少幻觉： 通过引用权威来源（如“根据《自然》期刊，气候变化导致极端天气增加”），提升回答可信度。
- 动态更新： 知识库可实时更新，模型无需重新训练即可获取最新信息。
技术挑战：
- 检索精度： 需优化检索算法，确保相关文档被准确召回。
- 上下文长度限制： 模型输入长度有限，需截断或压缩长文档。
应用场景：
- 企业客服： 整合产品手册、FAQ，提供专业解答。
- 法律咨询： 连接法律法规数据库，辅助法律分析。
- 医疗诊断： 结合电子病历和医学文献，生成诊断建议。
工具支持：
- 知识库管理工具： 如Dendron、Obsidian，支持结构化知识存储。
- RAG框架： 如LangChain、LlamaIndex，简化检索与生成流程。

大模型幻觉（Hallucination）

模型生成看似合理但错误的内容，因缺乏真正理解能力。例如，将"生鱼片是死鱼片"错误归类为语义矛盾。

Function Calling（函数调用）

定义： 模型通过调用预定义函数与外部系统交互，扩展能力边界。属于模型本身的能力，一般只有指令微调模型才具备这样的能力。
实现方式：
- 工具增强： 模型生成函数名及参数（如search_web(“2025年AI趋势”)），由外部系统执行并返回结果。
- 应用场景： 实时数据查询（如天气、股票）、复杂计算（如数学公式求解）。
优势： 突破模型知识截止限制，实现动态信息获取与操作执行；自动执行相关工具，实现特定操作。

Agent（智能体）

定义： 能够自主感知环境、做出决策并执行动作的实体。在大语言模型中，Agent指代具备自主任务规划与执行能力的模型实例。
特点：
- 自主性： 无需人类干预即可完成复杂任务（如预订机票、编写代码）。
- 交互性： 通过多轮对话与用户或环境交互（如调用API、查询数据库）。
案例： AutoGPT、BabyAGI等框架通过分解任务、调用工具（如Web搜索、计算器）实现自动化工作流。
技术挑战： 长期规划能力受限，在20步之后的执行稳定性较差；环境适应性较弱错误需要引入恢复机制。

Task-Driven Workflow（任务驱动型工作流）

定义： 一种结构化的问题解决方法，通过预定义的步骤（如任务分解、工具调用、结果整合）将复杂任务拆解为可管理的子任务，并利用大语言模型逐步完成。
特点：
- 步骤化执行： 将复杂任务分解为线性或分支步骤（如“数据收集→分析→可视化”）。
- 工具集成： 通过函数调用（Function Calling）接入外部系统（如数据库、API）。
- 人工监督： 支持人类在关键节点介入（如结果审核、参数调整）。
案例：
- 市场分析工作流：
1. 调用网络搜索工具收集行业数据。
2. 使用数据分析工具生成趋势图表。
3. 通过LLM生成报告摘要并推送至用户邮箱。
优势：
- 可控性： 步骤透明，便于调试与优化。
- 兼容性： 可集成现有工具链（如Python脚本、商业API）。
挑战：
- 灵活性不足： 难以应对未预见的任务分支。
- 人工依赖： 复杂任务仍需人工设计工作流。

Reason Action（推理动作）

定义： 在决策过程中，基于推理得出的行动步骤。
在大语言模型中的应用：
- 多步推理：模型将复杂问题分解为多个推理动作（如数学证明、逻辑推断）。
- 示例：解答"若a+b=10且a-b=2，求a²+b²"时，模型可能执行以下动作：
1. 解方程组得a=6, b=4。
2. 计算a²+b²=36+16=52。
技术挑战： 保持推理过程的连贯性与准确性，避免中间步骤错误。

MCP（Model Context Protocol）

定义： MCP（模型上下文协议）服务器是遵循Model Context Protocol的轻量级服务程序，作为AI模型与外部数据源、工具之间的标准化接口。它通过JSON-RPC 2.0协议实现双向通信，支持请求、响应和通知三种消息类型，确保AI模型能安全、高效地调用外部资源或工具。
核心功能：
- 资源暴露： 将本地文件、数据库、API等资源暴露给AI模型。
- 工具提供： 支持AI模型调用外部工具（如SQL查询、API请求）。
- 安全认证： 通过加密认证和访问控制机制保护数据安全。
技术架构：
- 客户端-服务器模型：
  - MCP主机（Host）： 如Claude Desktop、IDE等AI应用，负责发起请求。
  - MCP客户端（Client）： 内置于主机中，处理协议通信、安全认证和权限控制。
  - MCP服务器（Server）： 提供数据源访问和工具调用，支持本地（Stdio）和远程（HTTP/SSE）通信。
应用场景：
- 企业级数据集成： 连接CRM、数据库等，实现实时数据查询与自动化报告生成。
- 智能客服： 整合用户信息、订单数据，提供个性化服务。
- 软件开发： 与GitHub、代码库集成，支持代码生成、依赖分析。
- 物联网与实时决策： 在自动驾驶中调用传感器数据，实现低延迟响应。
- 医疗诊断： 连接电子病历系统，辅助医生分析患者数据。
优势：
- 标准化与灵活性： 通过统一协议减少定制开发，支持跨模型兼容。
- 安全性： 敏感数据（如API密钥）存储在服务器端，避免暴露给AI模型。
- 动态扩展： 支持插件化开发，第三方可快速集成新工具。

工作流 vs. Agent：对比分析

维度	任务驱动型工作流	智能体（Agent）
核心目标	通过结构化步骤完成预定任务	自主感知环境并动态决策
自主性	依赖人工设计步骤，自主性较低	具备自主规划与执行能力
交互性	支持人工介入（如审核结果）	完全自主交互（如调用API无需人工确认）
灵活性	适合标准化任务（如数据报告生成）	适合开放场景（如聊天、游戏AI）
技术依赖	依赖函数调用与工具集成	依赖强化学习与环境反馈
典型案例	自动化报表生成、客服脚本执行	AutoGPT、机器人控制、游戏NPC

共同点：
- 任务分解能力： 两者均需将复杂任务拆解为子任务。
- 工具调用： 均通过函数调用接入外部系统（如数据库、计算器）。
- 迭代优化： 均支持通过反馈循环改进性能（如工作流调整步骤、Agent通过强化学习优化策略）。
区别：
- 控制权归属： 工作流由人类主导设计，Agent由模型自主决策。
- 应用场景： 工作流适合结构化任务（如企业级自动化），Agent适合开放场景（如个性化助手）。
技术复杂度： 工作流实现门槛较低（依赖脚本编写），Agent需要高级技术（如强化学习、长期记忆管理）。

五、进阶术语与未来方向

多模态指令（Multimodal Instruction）

结合文本、图像等多模态数据的指令格式，如（指令, 多模态输入, 回答）三元组，推动AI向多模态交互演进。

元学习（Meta-learning）

学习"学习算法"，加速新任务适应。例如，通过少量示例快速掌握新领域知识。

对抗训练（Adversarial Training）

通过生成对抗样本增强模型鲁棒性，防御恶意攻击。

具身智能（Embodied AI）

结合物理实体的智能体（如机器人），通过与环境互动学习，如特斯拉Optimus机器人。

结语

大语言模型的技术演进正从参数规模竞争转向效率优化与应用落地。理解这些术语不仅是技术入门的基石，更是把握行业趋势的关键。从基座模型到指令微调，从量化部署到多模态融合，LLM的未来将深度融入千行百业，重塑人机交互范式。随着Agent、任务驱动型工作流等技术的成熟，模型将逐步从"语言处理器"进化为"智能执行体"，开启AI应用的新纪元。

男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
今晚吃太饱了爱伤心的蚂蚁
今晚吃太饱了，两碗干饭，两碗肉汤，一碗牛奶银耳汤，感觉肚子都顶出来了，圆滚滚的！明早要早起，出发去小蚂蚁家！看着剩下的肉汤，倒掉多可惜，干掉了！看着小蚂蚁熬的银耳汤，倒掉多可惜，于是热了一下，顺便热袋牛奶倒进去，大娃喝点，小蚂蚁喝点，还剩下一大碗，继续干掉！吃的太饱，人也懒洋洋的，躺床上不想动，感受的肚子撑撑的感觉，好久没吃这么饱了！这一晚灌的都是汤汤水水的，天冷的晚上，半夜要睡不安稳咯！哈哈！小
你对待万事万物的态度行靜
昨晚爸爸把洒水壶灌满水，对我说：你也该去浇浇你阳台上的花咯。这么大的天气，几天没浇水都快死了。我才意识到自己容易突然间忽视一些事情。尤其是身旁的一些事，可能它们呆久了，反而习以为常。想想每天的生活状态就是在不断的重复着一些事，有点固定模式。没有什么特别发生。记录我的一天：上班，挤公交，用手机或电脑，吃饭，上课。没有
承德十大亲子鉴定医院名单(附2024年10所正规医院) 国医基因陈主任
承德哪家医院可以做亲子鉴定？承德市中心医院、中国人民解放军第二六六医院、承德医学院附属医院等都可以做常规亲子鉴定采样采集，一般的医院并不可以为你提供常规亲子鉴定检测的服务。承德亲子鉴定中心地址：承德市西大街路北11号（承德国医基因）。一般只有少数三甲医院可以做亲子鉴定采样，或者当地亲子鉴定中心可以做亲子鉴定。如果想做亲子鉴定，最好直接到亲子鉴定中心内或亲子鉴定医院采样点内进行双方抽血鉴定，这样会更
践行8.0~第六周11.25-12.02 初队长
突破后的喜悦最可怕的不是自己不清楚，而是自己清楚了，却依然不心动，我想这就是我们每个人的惰性存在，在这一周的践行，我发现自己依然是停留在自己的模式当中，不断的恶性的轮回，虽然的话，那再晨间日记方面是纸质的填写，但是对一天的工作没有起到应有的计划和推动的作用而我自己呢，也有些时候的话会处于一个相对来讲放松的一个状态，时间的把控的话也有一些点的消极，所以在这周的间隙，重点是关注自己的三大目标为目标来进
5G基站信号加速器！AD8021ARZ-REEL7亚德诺超低噪声高速电压放大器专利失真消除技术! 深圳市尚想信息技术有限公司 5G通信高速运放 ADI黑科技 8K视频医疗超声
AD8021ARZ-REEL7ADI：重新定义高速放大器的性能极限！一、产品简介AD8021ARZ-REEL7是ADI（亚德诺半导体）推出的超低噪声高速电压反馈放大器，采用XFCB工艺和专利失真消除技术，专为4K/8K视频处理、医疗成像、5G通信等超高频应用设计。以1.8GHz带宽和0.1nV/√Hz超低噪声，成为高速信号调理的终极解决方案！二、五大颠覆性优势军工级信号保真度1.8GHz-3dB带
打造自己的梦想生态系统轻风style
今天听了第5周5.1的梦想系统和随堂练习：梦想仓库与八大关注表。参照老师给出的例子，列出了八大关注对应的自己的梦想。有些写的时候内心都在怀疑，但因为老师有说到，要没有分别心的去列出，不管是近的，远的，小的，大的，自己觉得可以实现的，或者觉得根本不可能实现的，都统统的列出来。就像音频中提到的，林语堂说过的话，梦想无论怎样模糊，总潜伏在我们心底，使我们的心境永远得不到宁静，直到这些梦想成为事实才止；像
我是孩子妈妈，我会让孩子饿着吗？松玲子
回老家过年，就是一场在关于喂养孩子问题上与老人的巅峰对决。前天我们回老家了，他爷爷奶奶就说孩子瘦了，就说我喂的不好，不按时喂，第一天夜里孩子总是睡一会就哭，睡一会就哭，夜里不知醒了多少次，弄得我真是几乎彻夜未眠。一大早，我还没起，我就听见他爷爷奶奶在外边说，今黑夜阳阳怎么老哭，是不是饿的，然后又延伸到我喂养的问题上，说不吃盐不行，不吃盐孩子没劲，吃蛋光吃个蛋黄，吃不饱，给他吃全蛋就行，哎呀我去，我
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
京东中秋节会打折吗？京东中秋节活动力度大吗？高省APP珊珊
京东中秋节会打折，并且活动力度通常是比较大的。以下是具体分析：京东中秋节打折情况降价促销：京东在中秋节期间会推出大规模的降价促销活动，涵盖食品、家居、家电等多个品类，以及众多热门品牌。消费者可以在此期间享受到实实在在的降价优惠。多种优惠形式：除了直接的降价促销，京东还会通过满减优惠、折扣促销、限时秒杀等多种形式的优惠活动来吸引消费者。这些优惠活动通常具有较高的吸引力，能够激发消费者的购买欲望。目前
农场种蔬菜赚钱小游戏有哪些五大可以赚钱的小游戏APP 氧惠帮朋友一起省
喜欢种菜吗？我特意带来农场种蔬菜赚钱小游戏排行榜2022，线上汇集了超多模拟种菜玩法，玩家可以免费种植赚钱哦！每天都有大量的种植任务，线上完成就能赚钱哦！快来下载吧！1.氧惠APP购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多少，非常厉害)，欢迎各位
严重的DDoS 攻击澳大利亚主要宽带提供商 Fancy1816575412
本周早些时候，澳大利亚最大的固定无线宽带运营商CirrusCommunications遭受了一次重大的DDoS攻击，导致其一半以上的网络瘫痪。该公司在其网站上声称：“强大的架构、数百个传输站点以及光纤和微波回程的使用使其能够以非常高的正常运行时间提供高速”。CirrusCommunications表示，它覆盖了澳大利亚十大人口中心以及几个主要的区域中心，主要为企业和政府客户提供服务。然而，据The
3次创业身价百亿，2年前却被大众判“死刑”，李想如今怎样了？职心眼儿
他，19岁放弃高考去创业；25岁，成为亿万富豪，被央视评为“80后创业”领军人物；39岁，身价再次暴涨，一夜间闯过200亿大关。他，在3个领域连续创业20年，一家公司市值700亿，一家公司市值2000亿。而他的最高学历，却只有高中。这个人，就是理想汽车的创始人——李想。纵观李想的创业史，可谓是颇为传奇：一个既没背景，又没资金高中毕业生，怎么就让3位互联网巨头（张一鸣、王兴、程维）同时为自己站台？更
【备孕故事】她一直想做个大差不离的人，没想到在这件事上拔了尖儿宜嘉阿姨
图片发自App杨婷说从小到大自己就是个中规中矩的人，不出格，不落单，一直随着大流。学业上从未出类拔萃，却也跟着大部队一起考上了一本；做事从不冒尖，搞个大差不离就行，因此，这么多年以来，差不多就行成了她对自己人生的要求。22岁大学毕业进了一家国企，外型不出挑但文静可人的她也遇上了两位追求者，简单的观察和交往后，她从中选了李广作为自己的婚恋对象。25岁那年，在父母亲朋的祝福声中杨婷和李广步入了婚姻。婚
黛玉葬花是一种什么心情爱的生命力
图片发自App小区里的花终于开了，带着孩子在小区散步的时候，无意间我注意到了玉兰，第一次我发现原来它是先开花后长叶子的，洁白如玉的花高耸入云，那种洁白，让人敬畏。因为有风，所以带孩子在楼遮挡的草坪上玩，发现紫叶李的花也开了，并且随着风的吹动，落了满地，孩子捡起一朵花，拿到我面前，细声细气的说“花”，我的大脑细胞瞬间激活，为什么不和孩子一起捡花呢！这可是一项好玩的游戏，于是我给孩子拿了一个大的挖土用
今天的彭格列依然被世界游戏吓得瑟瑟发抖呢云染舒倦
前言有一天，有一个白兰的大魔王想要毁灭世界，创世者非常不高兴，于是，创始者用吞噬一切，包容一切的大空（泽田纲吉）、捉摸不定的雾（六道骸）、孤高的浮云（云雀恭弥）、愤怒的忠岚（狱寺隼人）、晕染一切的雨（山本武）、守护之雷（蓝波）、热血之晴（晴川了平）创造了七位拯救世界的勇士（用属性制造勇士），让他们跟白兰对抗。。。［白兰的力量是游戏，于是要打败他，只要同样在世界布置的游戏中，赢过白兰就行了~］图片发
Qwen3 大模型实战：使用 vLLM 部署与函数调用（Function Call）全攻略曦紫沐大模型大模型部署 Qwen3 vLLM 函数调用
文章摘要本文将带你从零开始，深入掌握如何使用Qwen3-8B大语言模型，结合vLLM进行高性能部署，并通过函数调用（FunctionCall）实现模型与外部工具的智能联动。我们将详细讲解部署命令、调用方式、代码示例及实际应用场景，帮助你快速构建基于Qwen3的智能应用。一、Qwen3简介与部署环境准备Qwen3是通义千问系列的最新一代大语言模型，具备强大的自然语言理解和生成能力，尤其在函数调用、工
大模型量化终极对决：FP8 vs AWQ INT4，谁才是性能与精度的王者？曦紫沐大模型人工智能大模型量化 FP8 AWQ_INT4
摘要在大模型部署与优化中，量化技术是突破性能瓶颈的关键。FP8量化与AWQINT4量化作为当前主流方案，分别以“高精度”和“极致压缩”为核心优势。本文通过表格对比二者的数据格式、精度损失、硬件依赖及适用场景，助您在不同需求下精准选择最优方案。一、数据格式：浮点与整数的底层差异FP8量化采用浮点数（FP8），包含E4M3（4位阶码+3位尾数）和E5M2（5位阶码+2位尾数）两种格式，保留动态范围；而
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
2019-04-05 诚信装饰祝希信
2019年4月5日星期五天气晴(451)六年级七班祝全文今天是清明节，都放假了，好多人外出游玩踏青。一大早醒来去提水浇菜园子，全文还在呼呼睡大觉，浇完菜园子，简单吃了点饭就去干活了。中午回到家，厨房里乱七八糟，全文自己的脏衣服也没有洗，心里感觉真不是滋味，怎么会这样？优秀的孩子不是这样的，是我不该发脾气吗？还是回家继续忙碌，他人爱怎么怎么？家庭是共同的家庭，应该都有责任去承担，不要整天说来说去。全
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
打油旧作一首三闲居士a
又是一个春天，找出去年的一首打油，发在这里，温故而知新。沁园春晨练即景东风送暖，大地春回，无限妖娆。看仓圣公园，百花争艳，湖波荡漾，景色美妙。周末假日，游人如织，欢声笑语人如潮。一大早，更聚众晨练，男女老少。公园如此美好，引晨练人众呈英豪。有你吹铜管，我拉丝弦，这厢羊叫，那边驴嚎；电子音响，高音喇叭，锣鼓铙钹使劲敲。耳欲聋，看闹闹哄哄，乱七八糟。
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发