阿里云云原生

大模型 Token 的消耗可能是一笔糊涂账

作者：望宸

如果您正在部署大模型应用，务必提前和 CEO 打好预防针，大模型应用远不如 Web 应用在资源成本上那么可控。

经典的 Web 应用，例如电商、游戏、出行、新能源、教育和医疗等，CPU 的消耗是可控的，和应用的在线人数和登陆时长成正相关，如果计算资源突增，可能是运营团队在做活动，也可能是预期外的突发流量，通过服务器弹性扩容后，稳定一段时间就会缩容到平时的状态，后端所消耗的资源是可追踪、可管控的。但大模型的 token 消耗并不是。

目录：

01 大模型 token 消耗和哪些因素有关

02 大模型 token 消耗的隐蔽性来源

03 Agent 的资源消耗账本更加复杂

04 如何控制 token 的异常消耗初探

05 总结

大模型资源消耗和哪些因素有关

根据量子位的一篇文章【1】，当输入“树中两条路径之间的距离”，DeepSeek 就会陷入无限的思考，笔者实测消耗思考时间长达625秒（如下图），输出字数达2万字。这句话并不是复杂且意义不明的乱码，看上去完全就是一个普通的问题，非要挑刺的话，也就是表述得不够完整。

这种无限的重复思考，是模型自身的精神内耗，更会造成算力资源的浪费。如果被黑客滥用，无异于是针对推理模型的 DDoS 攻击。那么大模型的 token 消耗，除了和在线人数和时长有关，还和哪些因素有关呢？

本文仅以 DeepSeek 为例，其他大模型 API 调用的计费规则和影响计费的因子是类似的。

根据 DeepSeek 官方给出的【模型和价格】的计费文档上看【2】，API 调用费用和以下参数有关：

模型类型： V3 和 R1 的百万 tokens 的单价不同，R1 因为带有推理功能，定价比 V3 高
tokens 的输入数量： 按百万 tokens 计费，用量越多，费用越高
tokens 的输出数量： 按百万 tokens 计费，用量越多，费用越高，输出单价高于输入
是否命中缓存： 缓存命中的单价低于未命中的
忙时和闲时： 闲时的单价更低
思维链： 会消耗 token 的输出数量

此外，联网搜索过程中的搜索请求和对返回的数据处理（在内容生成前前的过程），也会计入 token 使用。但凡唤醒大模型意识的，其实都会消耗 token。

根据这个计费规则，大模型的资源消耗会和以下因素有关：

用户输入文本的长度： 用户输入文本越长，消耗的 token 越多。通常 1 个中文词语、1 个英文单词、1 个数字或 1 个符号计为 1 个 token。
模型输出文本的长度： 输出文本越长，消耗的 token 越多。以 DeepSeek 为例，输出的 token 消耗单价是输入的4倍。
用户输入的上下文大小： 上下文的情况下，由于模型在生成内容前要读取上几轮的对话内容，会显著增加模型的输入，导致 token 上涨。
任务的复杂性： 复杂的任务可能需要更多的 token。例如，生成长篇文本（例如论文翻译和解读）、进行复杂的推理（如数学、科学类问题），都需要更多的 token；如果是多模态、复杂 Agent 的形态，通常要比对话机器人消耗的 token 更多。
特殊字符、格式和标记： 可能会增加 token 消耗，例如，HTML 标签、Markdown 格式或特殊符号会被拆分成多个 token。
不同语言和编码方式： 对 token 消耗有影响，例如，中文通常比英文消耗更多的 token，因为中文字符可能需要更多的编码空间。
和模型自身有关： 例如同一个模型，参数高输出的内容翔实程度可能性更多，导致更容易消耗 token，就像越高越壮的人单位运动时内会消耗更多的能量；再例如，推理层未优化或优化少的，输出无效、低质量的内容更多的可能性更高，更容易消耗 token，就像同一个人训练过、掌握技巧后会控制自己的呼吸节奏，运动过程中少消耗能量。
是否使用了深度思考功能： 输出 token 数包含了思维链和最终答案的所有 token，因此打开深度思考，token 消耗更多。
是否使用了联网功能： 联网要求模型搜索外部知识库或网站，以获取外部知识，这些会作为输入 token 进行消耗，输出内容包含了外部链接和外部知识库内容，这些会作为输出 token 进行消耗。
是否采用了语义缓存功能： 由于缓存命中和未命中单价不同，采用语义缓存功能，可以降低资源消耗；若自行进一步优化缓存算法，可以降低更多资源消耗。

大模型资源消耗的隐形因素

除了上文提到的因素外，还有不少隐形因素会导致大模型应用资源的异常消耗。

代码逻辑漏洞

循环调用失控：因错误配置重试机制，导致单用户会话产生产生重复调用。
缓存机制缺失：高频重复问题未启用缓存，导致 Token 用于重复生成相似答案。

提示词工程缺陷

冗余上下文携带：若携带完整对话历史，单次请求的 Token 量会大幅增加，上下文对话越长，消耗量越大。
低效指令设计：未结构化的提示词，会降低模型生成效率。

生态依赖风险

插件调用黑洞：未限制插件调用深度，单次查询触发重复多次链式调用。
第三方服务波动：向量数据库响应延迟导致超时重试，间接增加 Token 消耗。

数据管道缺陷

数据预处理过程中产生的缺陷：数据清洗、预处理与标准化是提升输入质量的常规手段，例如用户输入时的错别字、缺失值、噪声数据等，可以通过数据清洗、预处理与标准化进行输入补全和纠正，但也存在某种可能，在补全和纠正过程中导致输入缺陷，从而产生资源的异常消耗。

Agent 的资源消耗账本更加复杂

说起 Agent，不得不提最近又火起来的 MCP。

1月，我们科普过 《MCP十问｜快速理解模型上下文协议》

3月，我们还将发布《MCP 货币化浅析》，欢迎关注 Higress 公众号

MCP 在大模型和第三方数据、API、系统的交互过程中，用单一的标准协议取代碎片化的集成方式 【3】 ，是 N x N 向 One for All 的演进，省去了不同外部系统接口代码的重复编写和维护工作，能以更简单、更可靠的方式让人工智能系统获取所需数据。

MCP 出现之前，Agent 需要借助 tool 去对接外部系统，planning 的任务越复杂，调用的外部系统数量和次数会越多，会带来很高的工程化成本。以下方的 Higress AI Agent 的流程图为例，当用户发出“我想在北京五道口附近喝咖啡，请帮推荐一下”，Agent 需要通过 tool 调用高德、点评的 API，若引入模型自我矫正过程，调用频次会进一步增加。

MCP 出现之后，将会加速诞生一波提供 MCP server 提供商。

例如 Firecrawl 今年1月通过与 Cline 平台的集成，正式引入了 MCP 协议，用户通过 Firecrawl 的 MCP 服务器调用其网页全自动爬取能力，避免逐一去对接目标网页的爬取过程，加速 Agent 的发展。昨天 OpenAI 发布 Responses API，并开源Agents SDK，相信 MCP 和 OpenAI 会作为 Agent 重塑劳动力市场的两条故事主线。

我们会越加理解这一观点，“AI 将目标对准的是企业的运营费用，而不是针对传统软件的预算。” 点击了解更多2025关于 AI 的前瞻观点。

说回 Agent，相比对话机器人，Agent 的 planing 和执行过程更加复杂，会消耗更多 token，下方是来自知乎作者@tgt 制作的图，从中我们可以看到，从输入开始，Agent 的计划、记忆、调用外部系统、执行输出，这些过程都会唤醒大模型，从而消耗 token，如果在输出内容前，再添加自我纠错的过程，以提升输出效果，token 更会成本增加。

近期爆火的 Manus，虽然展示很多执行效果不错的 user case，但带来的是背后算力的巨大消耗。总的来说，Agent 的成熟，会大幅提升对基础模型的调用量。

如何控制 token 的异常消耗初探

由于引起模型资源消耗的因素众多且复杂，不仅是一个产品或者方案就可以解决的，需要从事先、事中、事后建立建立完整的工程体系，由于我们仍处于 token 消耗的初期，以下仅作抛砖引玉，相信会看到精益大模型成本的更多实践。

（1）异常调用发生前：预防措施

a. 建立实时监控与阈值预警系统

监控系统： 部署资源监控仪表盘，实时跟踪 metric、log、trace 和 token 等基础观测指标，一旦发生异常调用，可快速排查故障，以及用于限流。【4】
访问控制： 对用户身份（如API Key）进行权限分级和访问控制，提供消费者鉴权功能，例如限制高频调用，避免恶意或误操作导致突发性资源占用。【5】

b. 数据预处理

格式检查： 在调用模型前，对用户输入进行格式、长度、敏感词等校验，过滤无效或异常请求（如超长文本、特殊符号攻击），减少无效 Token 消耗。
RAG 效果优化技术： 在向量检索前使用元数据进行结构化搜索，从而精准找到目标文档并提取相关信息，缩短输入长度，降低 Token 使用量。
语义缓存： 通过在内存数据库中缓存大模型响应，并以网关插件的形式来改善推理的延迟和成本。在网关层自动缓存对应用户的历史对话，在后续对话中自动填充到上下文，从而实现大模型对上下文语义的理解，以减少缓存未命中的 token 消耗。【6】

c. 参数调优

温度参数调优： 对模型的参数进行调优，以控制模型的输出行为。例如，调整温度（temperature）参数可以影响模型输出的随机性。降低温度值可以使模型输出更加确定性，减少不必要的 Token 生成。例如 DeepSeek 官方建议代码生成/数学解题，温度设置为0.0，通用对话，温度设置为1.3。
输出长度预设： 在调用模型时，预先设定输出的最大长度。根据具体任务的要求，明确告知模型输出的大致范围。例如，在生成摘要时，设置输出长度不超过 4k，避免模型生成过长的文本。DeepSeek 最高输出长度支持 8K。

（2）异常调用发生时：实时处理

a. 报警和限流阻断机制

报警： 针对 Token 消耗量、调用频率、失败率等核心指标，设置动态基线阈值，一旦超过阈值，就触发警报。
限流和熔断： 当检测到 Token 消耗突增或失败率异常，可以是 URL 参数、HTTP 请求头、客户端 IP 地址、consumer 名称、cookie中 key 名称，自动触发限流，甚至阻断，保障核心功能，控制爆炸半径。【7】

b. 异常调用溯源与隔离

临时封禁： 通过日志分析定位异常调用来源（如特定用户、IP或API接口），临时封禁异常请求方，防止资源进一步浪费。

（3）异常调用发生后：恢复与优化

a. 数据补偿与代码修复

减少统计误差： 统计对因数据更新延迟导致的统计误差（如 Token 消耗记录缺失），通过离线计算任务重新校准数据，确保计费和监控系统的准确性。
代码审查与修复： 对调用大模型的代码进行审查，修复可能存在的逻辑错误或漏洞。例如，检查是否存在循环调用模型的情况，避免无限循环导致的异常 Token 消耗。

b. 攻击溯源与防御策略升级

分析异常调用日志： 识别是否为对抗性攻击（如投毒攻击或恶意生成请求），更新黑名单规则并部署输入过滤模型。
增强身份认证机制： 如双因素验证，防止 API Key 泄露导致的资源滥用。
自动化预警与处理机制完善： 完善自动化预警和处理机制，提高系统对异常 Token 消耗的响应能力。例如，优化警报规则，使警报更加准确和及时；改进异常处理流程，提高处理效率。

c. 长期优化措施

Token 分级管理： 为不同业务分配不同权限的 Token，降低核心服务Token的暴露风险。
自动化测试与演练： 定期模拟 Token 异常场景（如过期、失效），验证容错机制的有效性。

总结

过去，我们投入了大量时间和精力在基础设施资源利用率的提升上；当下，所有从事 AI Infra 的企业都专注在资源的利用率上，从底层硬件、模型层、推理优化层，以及在往上的网关入口层，这将是一场工程和算法比翼的长跑。

参考链接：

[1] https://mp.weixin.qq.com/s/eBqg2hHFQTKCrNKCJHV-Iw

[2] https://api-docs.deepseek.com/zh-cn/quick_start/pricing

[3] https://mp.weixin.qq.com/s/zYgQEpdUC5C6WSpMXY8cxw

[4] https://help.aliyun.com/zh/api-gateway/cloud-native-api-gateway/user-guide/ai-observability

[5] https://help.aliyun.com/zh/api-gateway/cloud-native-api-gateway/user-guide/configure-consumer-authentication

[6] https://help.aliyun.com/zh/api-gateway/cloud-native-api-gateway/user-guide/ai-cache

[7] https://help.aliyun.com/zh/api-gateway/cloud-native-api-gateway/user-guide/ai-token-throttling

Higress 是阿里云开源的一款高性能网关，用于部署 Web 应用和大模型应用，并提供商业版服务，阿里云官网搜索「API 网关」。

Higress 官网：

https://higress.cn/

API 网关官网：

https://www.aliyun.com/product/apigateway

Serverless架构下Spring Function的创新实践 tmjpz04412 serverless 架构 spring
引言：Serverless与Spring生态的交汇背景介绍：云计算与Serverless架构的兴起Spring生态的演进与云原生适配性核心问题：传统Spring应用如何融入Serverless范式Serverless架构的核心特征与挑战事件驱动、弹性伸缩与按需计费冷启动问题与性能优化需求Spring应用在Serverless环境中的典型瓶颈（如依赖注入、上下文初始化）SpringFunction的
Spring Boot与云原生：微服务架构的创新实践 tmjpz04412 spring kubernetes 云原生 java graphql
引言：Spring生态的演进与现状Spring框架的发展历程与核心设计理念当前Spring生态的核心组件（SpringBoot、SpringCloud、SpringData等）行业对Spring生态的依赖与创新需求SpringBoot的创新实践1.自动化配置与启动优化条件装配（@Conditional）的深度定制案例启动类加载机制与类路径扫描优化示例：通过自定义Starter实现快速集成第三方服务
python中的 JWT weixin_34355881 python json php
Jsonwebtoken(JWT),是为了在网络应用环境间传递声明而执行的一种基于JSON的开放标准（(RFC7519).该token被设计为紧凑且安全的，特别适用于分布式站点的单点登录（SSO）场景。JWT的声明一般被用来在身份提供者和服务提供者间传递被认证的用户身份信息，以便于从资源服务器获取资源，也可以增加一些额外的其它业务逻辑所必须的声明信息，该token也可直接被用于认证，也可被加密。基
【Python】PyJWT：轻松实现 JSON Web Token (JWT) 网络令牌的生成与验证 @Unity打怪升级 Python python json 网络开发语言前端 pip ipython
PyJWT是一个用Python实现的轻量级库，用于处理JSONWebToken(JWT)。JWT是一种安全的方式，用来表示双方之间经过签名的令牌，通常用于认证和授权场景。PyJWT简化了JWT的生成和验证过程，使得开发者能够轻松地在Python项目中集成JWT功能。在这篇博客中，我们将深入介绍PyJWT，展示如何生成、解码和验证JWT令牌，并且会通过代码示例演示如何在实际项目中使用PyJWT进行认
阿里云服务器怎么选？2023年哪款最好最具性价比阿里云最新优惠和活动汇总
在选购阿里云服务器的时候，云服务器能稳定运行我们的程序或应用，费用也不贵，对我们来说就是最好最具性价比的云服务器，结合阿里云官方的最新活动，小编为个人用户和企业用户整理了几款2023年值得重点考虑的活动云服务器，活动价格很低，实用性也很强。一、个人和企业用户一般会买什么配置的阿里云服务器很多个人站长的小型网站一般选用的是1核2G内存和2核4G内存的服务器为多，基本上抗住访问无压力。而企业用户则需要
Coze Studio 架构拆解：AI Agent 开发平台项目结构全分析代码简单说 2025开发必备(限时特惠)架构人工智能 Coze Studio 架构 AI Agent 开发平台全栈 AI 工程化图解架构
CozeStudio架构拆解：AIAgent开发平台项目结构全分析标签：CozeStudio项目架构、领域驱动设计DDD、全栈开发规范、Hertz框架、前后端协作、云原生容器、前端测试、IDL接口设计、微服务解耦、AI开发平台源码分析在最近研究AIAgent开发平台的过程中，我深入分析了刚刚开源的CozeStudio项目。这套系统是国内少有的开源全栈AI工程化项目，代码整洁、架构先进，特别是它基于
阿里云个人用户可优惠购买的云服务器配置及价格汇总（最新版）阿里云最新优惠和活动汇总
阿里云活动中的云服务器分为新用户专享和企业新用户专享，其实新用户专享主要就是针对阿里云个人用户的，活动中的一些入门级云服务器就是主要为个人用户准备的，尤其是1核2G、2核4G这些配置，下面是阿里云个人用户可优惠购买云服务器配置及价格汇总。目前阿里云活动中可购买的云服务器时长为1个月、2个月、3个月、6个月和1年，不同活动中的云服务器购买时长有所不同，下面是个人用户可个人用户可优惠购买的月付和年付云
Consul 与 Hive：云原生数据仓库集成 AI云原生与云计算技术学院 AI云原生与云计算数据仓库 consul hive ai
Consul与Hive：云原生数据仓库集成关键词：Consul、Hive、云原生、数据仓库集成、服务发现摘要：本文深入探讨了Consul与Hive在云原生环境下的数据仓库集成。首先介绍了集成的背景和相关概念，包括Consul的服务发现机制和Hive作为数据仓库的特点。接着详细阐述了核心概念及联系，通过文本示意图和Mermaid流程图展示其架构。对集成所涉及的核心算法原理进行了讲解，并给出Pytho
阿里云企业新用户与个人新用户首次购买云服务器配置推荐阿里云最新优惠和活动汇总
2023年阿里云活动中的云服务器实例规格以通用算力型u1、计算型c7、通用型g7、内存型r7等为主，但是阿里云将各活动中的云服务器可选带宽统一调整成为了1-5M可选，也就是说在活动中购买云服务器最大只能选5M带宽了，活动时长也由以往的1-3年改为现在的1年为主，根据目前的活动信息，小编决定为大家推荐两款值得企业新用户与个人新用户首次购买时选择的阿里云服务器。阿里云个人新用户首次购买云服务器推荐推荐
2025年云服务器怎么选？云服务器性价比指南 telunxiaosu1 服务器运维阿里云华为云京东云
写作初衷：作为一个购买多年云服务器经历的爱好者，最喜欢看各厂商的优惠活动，反复比较各厂商的优惠，找到最具性价比的那一款。我就像一个互联网的猹，在京东云、阿里云、腾讯云的官网里反复对比、反复横跳，但不得不说，这个过程还是比较累的，尤其是网上的众多活动叠加，新客专享，生怕自己被背刺。所以，写下这篇文章，制成excel汇总表，供大家参考，包括了京东云、阿里云、腾讯云、华为云4大厂商（别的小厂怕跑路hhh
Spring框架深度解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）、《解密程序员的思维密码——沟通、演讲、思考的实践》作者、清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队
Spring框架核心技术解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）、《解密程序员的思维密码——沟通、演讲、思考的实践》作者、清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队
并发编程与MyBatis精髓 AIHacksCash Java场景面试宝典 Concurrency Java Database Framework
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
ShardingSphere核心技术解析 AIHacksCash Java场景面试宝典 ShardingSphere Distributed Database Database Sharding
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
阿里云通用型实例云服务器收费标准及最新活动价格参考阿里云最新优惠和活动汇总
通用型实例云服务器是很多企业级用户在购买阿里云服务器时比较喜欢选择实例规格，因为通用型实例云服务器的CPU与内存配比大多都是1：4，内存资源要高于cpu资源，这种搭配多适用于中小型数据库系统、缓存、搜索集群等场景，也适用于与网站应用等场景。通用型阿里云服务器图.png阿里云服务器通用型实例规格有哪些？目前属于通用型实例云服务器的实例规格有:通用型实例规格族g8a通用型实例规格族g8i通用平衡增强型
ShardingSphere架构解析 AIHacksCash Java场景面试宝典 ShardingSphere Distributed Database Database Sharding
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
智能家居平台服务端安装教程——东方仙盟部署未来之窗软件服务过去未来疑难破阵录 github linux 运维仙盟创梦IDE 东方仙盟智能家居
1.准备工作登录阿里云服务器：使用SSH工具（如ssh命令）登录到你的阿里云Linux服务器。确保服务器已安装并能正常运行，且网络连接正常。更新系统软件包：执行以下命令更新系统软件包到最新版本。bashsudoaptupdatesudoaptupgrade-y2.安装依赖HomeAssistant是基于Python的应用，需要安装Python及其相关依赖。bashsudoaptinstall-yp
阿里云账户新老用户查询指南及优惠策略详解阿里云最新优惠和活动汇总
阿里云经常推出各种优惠活动，其中不少优惠仅限新用户享受，那么，如何判断自己的阿里云账户是新用户还是老用户？新老用户之间又有何区别？下面小编根据自己的经验为您详细解答这些问题，并提供一些针对老用户的优惠策略。一、阿里云用户分类及定义在阿里云的用户体系中，主要存在以下几种用户类型：新用户、企业新用户、产品新用户和老用户。了解这些用户类型的定义，有助于我们更好地判断自己的用户身份。新用户新用户是指在阿里
Azure-in-bullet-points项目解析：深入理解Azure Service Fabric架构与技术实践萧桔格Wilbur
Azure-in-bullet-points项目解析：深入理解AzureServiceFabric架构与技术实践一、AzureServiceFabric概述AzureServiceFabric是微软提供的分布式系统平台，专为构建和管理可扩展、可靠的微服务而设计。作为云原生应用开发的核心技术，它解决了现代分布式系统开发中的诸多挑战。核心特性集群管理能力：基于共享机器池（集群）构建，实现资源的高效利用
RAG流程中，要怎么对文本进行拆词？ java干货仓库八股文汇总大模型面试人工智能自然语言处理 llama
在RAG（Retrieval-AugmentedGeneration）流程中，对文本的拆词（Tokenization）是影响检索和生成效果的关键步骤。以下是文本拆词的技术细节及优化方法：1.拆词的核心目标检索阶段：确保查询（Query）和文档（Document）的拆词方式一致，提高检索匹配精度。生成阶段：适配大模型的词表，避免生成时的OOV（Out-of-Vocabulary）问题。2.常见拆词方
CentOS-Stream-9 CentOS9 配置国内yum源-阿里云源
yum配置文件路径centos.repocentos.repo配置文件是CentOS系统中用于配置yum软件仓库（repository）的文件。这个文件定义了yum从哪些URL地址获取软件包。/etc/yum.repos.d/centos.repocentos-addons.repocentos-addons.repo配置文件是CentOS系统中用于配置额外软件仓库（repository）的yum
优化提示内容生成技术框架：提示工程架构师的坚实后盾
优化提示内容生成技术框架：提示工程架构师的坚实后盾引言背景：大语言模型时代的“提示瓶颈”当GPT-4、Claude3、Gemini等大语言模型（LLM）的参数规模突破万亿、上下文窗口扩展至百万token时，一个矛盾逐渐凸显：模型能力的跃升与提示质量的滞后，正在成为制约AI应用落地的核心瓶颈。2023年斯坦福大学的研究显示，在企业级LLM应用中，70%的功能故障源于提示设计缺陷——或因指令模糊导致输
ubuntu国内镜像源手动配置鬼才血脉 ubuntu linux 运维
备份当前源列表打开终端，执行以下命令备份当前的源列表：sudocp/etc/apt/sources.list/etc/apt/sources.list.backup编辑源列表文件使用文本编辑器编辑/etc/apt/sources.list文件，例如使用nano：sudovim/etc/apt/sources.list添加或修改镜像源将文件中的内容替换为适合的国内镜像源地址。例如，使用阿里云的镜像源
Kubeadm 快速搭建 k8s 集群&&安装可视化管理界面头发莫的了呀 Kubernetes kubernetes docker 运维
文章目录1.实验准备2.安装docker3.配置阿里云K8Srepo源（三个节点）4.安装kubeadm，kubelet，kubectl（三个节点）5.部署kubernetesMaster节点（master节点上执行）6.k8s-node节点加入master节点（两个node执行）7.安装Pod网络插件（CNI插件，master节点）8.master节点安装可视化管理界面dashboard1.实验
初始化 K8s 主节点时报错failed to pull image registry.aliyuncs.com/google_containers/kube-apiserver:v1.23.17 Ashmcracker kubernetes 容器云原生
运行r如下命令初始化kubernetes的master节点2025年3月12日更新：阿里云的镜像仓库目前只给它自己云上的服务器使用了，建议更换华为云的镜像加速器https://support.huaweicloud.com/usermanual-swr/swr_01_0045.htmlkubeadminit\--kubernetes-version=v1.23.17\--image-reposit
python和vue结合开发前端,请手动配置Vue开发环境小六oO 智能写作 vue.js 前端 javascript
vue怎么全局定义一个变量代替路径。原理：设置一个专用的的全局变量模块文件，模块里面定义一些变量初始状态，用exportdefault暴露出去，在里面使用Vue.prototype挂载到vue实例上面或者在其它地方需要使用时，引入该模块便可。全局变量模块文件：文件：constserverSrc='';consttoken='12345678';consthasEnter=false;constus
Claude 4 全新上线，科研和写作能力大幅提升！文献检索和综述更容易，实测好用！（附专业提示词）智写AI AI学术写作指南人工智能
在2025年5月22日，Claude正式发布了它的4系列模型：Opus4和Sonnet4七哥总结下这两款模型的特点，Sonnet4适合快速响应的任务，Opus4适合需要推理的复杂多步骤任务。两款模型都有20万token的上下文窗口。对科研人员、程序开发者来说，Claude这一代模型不仅性能强悍，还在多项核心能力上实现了突破式进阶。说说最新亮相的Claude4系列模型在多项核心能力上的三大进阶之处：
阿里云服务器购买参考，适合个人和普通企业用户的阿里云服务器推荐阿里云最新优惠和活动汇总
无论是个人开发者、初创企业，还是已经成熟的公司，只要有建站，做APP，存储数据等需要就需要一台云服务器。阿里云针对不同用户的需求推出了多款云服务器产品。本文将重点介绍适合个人和普通企业用户的阿里云服务器，帮助您找到性价比最高的云计算解决方案。一、阿里云服务器的用户群体阿里云服务器的用户主要可以分为三类：个人用户、普通企业用户以及对云服务器性能有特殊需求的集团型企业级用户。对于不同类型的用户，阿里云
DDD实战精要我是廖志伟 Java场景面试宝典 DDD Software Architecture Domain-Driven Design
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）、《解密程序员的思维密码——沟通、演讲、思考的实践》作者、清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队
微服务架构核心技术解析我是廖志伟 Java场景面试宝典 Spring Cloud Microservices Service Governance
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）、《解密程序员的思维密码——沟通、演讲、思考的实践》作者、清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，