陈乔布斯

大模型微服务架构：拆解AI应用的资源密码

引言：为什么大模型应用需要微服务架构？

想象你经营一家网红餐厅，刚开始只有一个厨师负责所有菜品（类似单体架构）。随着生意火爆，顾客需要川菜、粤菜、甜品等多种选择，单个厨师忙不过来，还经常出错。于是你招聘了川菜师傅、粤菜师傅、甜品师，每人专注一个领域（类似微服务架构），效率和质量立刻提升——这就是大模型应用从单体架构转向微服务的核心原因。

随着ChatGPT、文心一言等大模型技术的爆发，互联网企业正将大模型融入各类业务：电商平台的智能推荐、客服机器人，内容平台的文本生成、代码辅助开发等。但大模型应用有三个显著特点：

资源密集：模型参数量动辄数十亿甚至千亿级，推理时需占用大量GPU资源；
场景复杂：可能同时支持实时对话（如客服）、批量处理（如文案生成）、多模态交互（图文结合）；
迭代频繁：模型版本每周甚至每天更新，业务功能也需快速调整。

传统单体架构会导致三大痛点：

资源浪费：模型推理模块与业务逻辑强耦合，即使修改一个小功能，也需整体部署，GPU资源长期被闲置模块占用；
扩展性差：实时对话需低延迟（毫秒级），批量处理需高吞吐量，单体架构无法针对性扩容；
迭代困难：模型更新与业务迭代相互阻塞，比如想上线新模型，却要等业务代码一起测试部署。

微服务架构通过将应用拆分为独立部署的小型服务，完美解决了这些问题。本文将用"餐厅经营"的类比，结合电商推荐系统实战案例，解析大模型微服务架构的设计原则、核心组件和优化技巧。

一、大模型微服务架构的核心设计原则

大模型微服务架构设计，需在传统微服务"高内聚、低耦合"原则基础上，额外关注模型特性与资源效率。以下五大原则，可类比餐厅的"部门管理规范"：

1.1 按"业务场景+模型能力"垂直拆分服务（类似餐厅分部门）

传统微服务常按"功能模块"拆分（如用户服务、订单服务），但大模型应用需进一步结合模型能力边界拆分。就像餐厅按"川菜"“粤菜”"甜品"分部门，每个部门有专属厨师和食材。

例如，一个电商大模型平台可拆分为：

智能推荐服务：基于用户行为和商品数据，调用推荐大模型生成个性化商品列表（类似"点餐推荐师"）；
智能客服服务：集成对话大模型，处理用户咨询、售后问题（类似"前台服务员"）；
内容生成服务：调用文本生成模型，自动生成商品描述、营销文案（类似"菜单设计师"）。

优势：每个服务可独立选择适配的模型（如推荐服务用轻量级模型保证低延迟，内容生成服务用大模型保证质量），避免"一个模型包打天下"的资源浪费。

1.2 模型服务与业务服务解耦（厨师不负责点菜）

将"模型推理"与"业务逻辑"拆分为独立服务，就像餐厅里"厨师"（模型服务）只负责做菜，不直接面对顾客；“服务员”（业务服务）负责点菜和上菜，不进厨房。两者通过"菜单"（API接口）沟通。

解耦方式：业务服务通过API调用模型服务，模型服务不依赖任何业务逻辑。例如，推荐业务服务负责筛选候选商品，再调用推荐模型服务进行排序，模型服务升级时（如从GPT-3.5切换到GPT-4），业务服务完全不用修改。

1.3 资源隔离与弹性伸缩（高峰期多雇厨师）

大模型推理是资源密集型任务，需针对不同服务的资源需求进行隔离，就像餐厅把"后厨"（模型服务，需GPU）和"前厅"（业务服务，需CPU）分开，避免顾客和厨师抢空间。

资源策略：

计算资源隔离：模型服务部署在GPU服务器，业务服务部署在CPU服务器；
弹性伸缩：通过K8s自动扩缩容——当模型服务GPU利用率超过70%时自动"加派人手"（增加实例），低于30%时"减少人手"（减少实例），避免资源闲置。

1.4 全链路可观测性（餐厅装监控）

大模型推理过程像"黑盒子"，需构建覆盖"请求-推理-响应"全链路的监控体系，就像餐厅在前台、后厨装监控，实时查看客流、出餐速度、顾客满意度。

监控重点：

性能监控：模型服务的推理延迟（如P99延迟500ms）、GPU显存占用（如不超过80%）；
质量监控：推荐商品点击率（目标>5%）、客服问题解决率（目标>90%）；
链路追踪：通过工具串联从用户请求到模型推理的完整路径，定位"哪个环节慢了"。

1.5 降级与容错机制（菜没了换备选）

大模型推理可能因GPU故障、模型加载失败等异常，需设计多层容错策略，就像餐厅某道菜原料用完时，能快速推荐替代品，或赠送小礼品安抚顾客。

容错手段：

服务降级：模型服务不可用时，返回缓存结果或默认推荐（如热门商品列表）；
超时控制：调用模型服务时设置超时时间（实时场景500ms，非实时场景5s）；
重试机制：对瞬时错误（如网络抖动）重试2次，避免请求直接失败。

二、核心组件解析：大模型微服务架构的"积木块"

一个完整的大模型微服务架构由六大核心组件构成，像餐厅的"前厅、后厨、采购、收银"等部门，各司其职又协同工作。

2.1 API网关：流量入口与统一管控（餐厅前台）

作用：作为所有用户请求的"前台接待员"，负责路由转发、鉴权限流、协议转换。

大模型场景特殊需求：

动态路由：根据请求场景（如"推荐"vs"客服"）将流量路由到不同微服务；
大模型请求限流：按用户/场景设置QPS上限（如普通用户5次/分钟，VIP用户20次/分钟），避免GPU资源被过度占用；
请求优先级：对实时对话请求标记"加急"，优先分配模型资源。

技术选型：APISIX（轻量、高性能）、Kong（插件丰富）。

2.2 服务注册与发现：动态管理服务地址（餐厅员工通讯录）

作用：微服务启动时自动"上报工位"，其他服务通过"通讯录"查询地址，无需硬编码IP。

大模型场景特殊需求：

GPU节点标签：记录模型服务所在节点的GPU型号（如A100、V100），便于业务服务选择"算力匹配"的模型服务；
健康检查：除常规存活检查外，增加GPU健康检查（如显存使用率、温度），自动剔除"生病"的节点。

技术选型：Nacos（国产开源，适配K8s）、Consul（支持服务网格）。

2.3 大模型服务：推理能力的"发动机"（后厨厨师）

作用：封装模型加载、推理计算逻辑，对外提供标准化推理接口，像厨师专注做菜，不关心谁点的菜。

核心设计：

模型封装：用FastAPI构建HTTP接口，或gRPC提升高并发性能；
模型管理：通过Hugging Face Transformers加载模型，支持多版本并存（如v1、v2模型同时部署）；
推理优化：采用TensorRT加速推理，或INT8量化减少显存占用。

代码示例（Python/FastAPI实现推荐模型服务）：

from fastapi import FastAPI, HTTPException
from pydantic import BaseModel
from transformers import AutoModelForSequenceClassification, AutoTokenizer
import asyncio
import torch

app = FastAPI(title="商品推荐模型服务")

# 模型加载（生产环境建议用模型管理工具动态加载）
model = AutoModelForSequenceClassification.from_pretrained("./recommendation-model-v1")
tokenizer = AutoTokenizer.from_pretrained("./recommendation-model-v1")
model.eval()  # 推理模式

# 请求/响应数据格式定义
class RecommendRequest(BaseModel):
    user_id: str
    user_behavior: list  # 用户行为：[{"item_id": "123", "action": "click", "time": "2023-10-01"}]
    candidate_items: list  # 候选商品：[{"item_id": "456", "category": "electronics"}]

class RecommendResponse(BaseModel):
    ranked_items: list  # 排序结果：[{"item_id": "456", "score": 0.92, "rank": 1}]

@app.post("/recommend", response_model=RecommendResponse)
async def recommend(request: RecommendRequest):
    try:
        # 1. 数据预处理（异步处理避免阻塞）
        loop = asyncio.get_event_loop()
        inputs = await loop.run_in_executor(
            None,  # 使用默认线程池
            lambda: tokenizer(
                [f"user:{b['item_id']},action:{b['action']}" for b in request.user_behavior],
                padding=True, truncation=True, return_tensors="pt"
            )
        )
        
        # 2. 模型推理（禁用梯度计算加速）
        with torch.no_grad():
            outputs = model(**inputs)
            scores = torch.softmax(outputs.logits, dim=1)[:, 1].tolist()  # 推荐分数
        
        # 3. 结果排序与组装
        ranked_items = sorted(
            zip(request.candidate_items, scores),
            key=lambda x: x[1], reverse=True
        )
        
        return {
            "ranked_items": [
                {"item_id": item["item_id"], "score": round(score, 3), "rank": i+1}
                for i, (item, score) in enumerate(ranked_items[:20])  # 返回Top20
            ]
        }
    
    except Exception as e:
        # 异常捕获与降级准备
        raise HTTPException(status_code=503, detail=f"模型服务暂时不可用: {str(e)}")

代码解析：

异步处理：使用asyncio.run_in_executor将预处理任务放入线程池，避免阻塞FastAPI的事件循环，提升并发能力；
推理优化：torch.no_grad()禁用梯度计算，减少显存占用和计算时间；
异常处理：捕获推理过程中的异常并返回503状态码，为上游服务的降级策略提供依据；
结果格式化：返回包含商品ID、分数和排名的结构化数据，方便业务服务直接使用。

2.4 业务服务：场景逻辑的"编排者"（前厅服务员）

作用：处理具体业务逻辑，如用户行为分析、候选商品筛选、结果后处理，像服务员协调点菜、催菜、上菜全流程。

核心设计：

无状态设计：不存储本地数据，便于水平扩展（随时加服务员）；
结果缓存：用Redis缓存高频请求结果（如热门商品推荐，30分钟过期）；
降级策略：模型服务异常时，切换到"兜底逻辑"（如返回运营配置的固定推荐列表）。

2.5 数据存储服务：支撑模型与业务的数据底座（仓库与冰箱）

作用：存储用户数据、商品数据、模型输入输出日志等，像餐厅的"仓库"（长期存储）和"冰箱"（短期保鲜）。

数据分类与存储方案：

数据类型	存储工具	类比场景
用户/商品基本信息	MySQL/PostgreSQL	仓库货架（结构化存储，长期保存）
用户行为数据	MongoDB/Kafka	冰箱（非结构化，需快速存取）
推荐结果缓存	Redis	备餐台（临时存放，快速取用）
模型训练数据	HDFS/对象存储	食材冷库（海量数据，长期存储）

2.6 消息队列：异步通信与流量削峰（传菜窗口）

作用：实现服务间异步通信，像餐厅的"传菜窗口"，后厨做完菜放窗口，服务员来取，避免厨师和服务员直接等待。

大模型场景应用：

非实时任务异步化：批量商品描述生成（业务服务将任务放入队列，内容生成服务异步消费）；
流量削峰：促销活动时推荐请求突增，消息队列暂存请求，避免模型服务被压垮；
事件驱动：用户行为数据写入队列，模型训练服务监听队列，实时更新训练样本。

技术选型：Kafka（高吞吐，适合行为数据）、RabbitMQ（支持复杂路由，适合业务消息）。

三、实战案例：电商智能推荐系统的微服务架构

为让架构设计更具体，我们以"电商智能推荐系统"为例，详细解析服务拆分、交互流程与关键设计。

3.1 系统架构图（Mermaid可视化）

该系统包含五大微服务，通过API网关串联，模型服务与业务服务完全解耦：

3.2 核心流程时序图：用户请求商品推荐

以下是用户打开电商APP首页，获取个性化推荐列表的完整流程（含缓存逻辑、服务调用、模型推理）：

3.3 关键设计解析

（1）缓存策略优化推荐延迟

缓存粒度：按"用户ID+场景"缓存（如user_123_home_recommend），避免缓存穿透；
过期时间：首页推荐30分钟，详情页推荐5分钟（用户可能频繁刷新）；
缓存预热：每日凌晨批量计算热门用户的推荐结果并缓存，减少高峰期模型服务压力。

（2）模型服务的资源弹性调度

GPU资源动态分配：通过K8s将实时场景（如首页推荐）调度到A100节点（快），非实时场景（如批量召回）调度到V100节点（成本低）；
推理任务优先级：模型服务内部维护队列，首页推荐标记为"高优先级"（超时500ms），批量任务标记为"低优先级"（超时5s）。

（3）降级与容错实现（多级降级策略）

四、性能优化与挑战

4.1 核心性能优化手段（让系统"跑更快"）

（1）模型推理优化

模型量化：将FP32模型转为INT8/FP16，显存占用减少50%-75%，推理速度提升2-3倍（需平衡精度损失）；
批处理（Batching）：合并多个用户请求批量推理，GPU利用率从30%提升至80%以上（批大小需测试最优值）；
推理引擎加速：使用TensorRT优化模型计算图，或ONNX Runtime支持多框架统一部署。

（2）服务通信优化

协议选择：实时场景用gRPC（二进制协议，比JSON快5-10倍），非实时场景用HTTP/JSON（开发成本低）；
连接池复用：业务服务与模型服务之间维护长连接池，避免频繁TCP握手开销。

4.2 面临的挑战与解决方案

挑战	解决方案	实施效果
模型版本管理复杂	使用MLflow跟踪模型版本，通过请求参数`model_version`指定版本	支持A/B测试，模型更新无需停服
GPU资源成本高	非高峰时段自动缩容GPU节点，使用模型蒸馏部署轻量级模型	资源成本降低40%，精度损失<5%
服务依赖链长（推荐服务依赖5个下游服务）	采用"故障注入测试"模拟服务故障，验证降级策略	系统可用性从99.9%提升至99.99%
数据隐私风险（用户行为数据输入大模型）	对敏感字段脱敏，采用联邦学习训练模型	通过数据合规审计，用户隐私零泄露

五、总结

大模型应用的微服务架构设计，核心是通过"模型-业务解耦"和"资源弹性调度"，平衡性能、成本与迭代效率。就像经营一家高效的餐厅，需要合理分工（服务拆分）、专业团队（组件设计）、应急预案（降级容错），才能在客流高峰（高并发）时依然保持优质服务。

未来，大模型微服务架构将向三个方向演进：

模型即服务（MaaS）：企业无需自建模型服务，直接调用云厂商API（如AWS SageMaker、阿里云PAI），降低技术门槛；
边缘推理：轻量级模型部署在边缘节点（如CDN服务器），减少网络延迟，提升实时性；
自适应架构：AIOps工具自动调整服务扩缩容策略、模型推理参数，实现"架构自优化"。

对于互联网开发者而言，掌握大模型微服务架构设计，不仅能提升应用性能与稳定性，更能在AI技术快速迭代的浪潮中，保持业务的敏捷性与竞争力。

附录：关键技术栈选型参考

组件类型	推荐工具	适用场景	优势
API网关	APISIX	轻量级、高性能需求	动态路由、限流插件丰富，适合大模型流量管控
服务注册发现	Nacos	国产K8s生态	支持服务健康检查、GPU节点标签，适配国内云环境
模型服务框架	FastAPI+Triton	快速开发+高并发推理	前者适合原型开发，后者支持动态批处理、多模型管理
消息队列	Kafka	高吞吐场景（用户行为数据）	每秒处理百万级消息，适合模型训练数据采集
缓存	Redis Cluster	分布式缓存需求	支持数据分片、主从复制，缓存推荐结果降低模型调用
监控	Prometheus+SkyWalking	全链路监控	指标监控、链路追踪、日志分析一体化，定位问题快

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
（二）SAP Group Reporting (GR) 核心子模块功能及数据流向架构解析
数据如何从子公司流转到合并报表的全过程，即数据采集→合并引擎→报表输出，特别是HANA内存计算如何优化传统ETL瓶颈。SAPGroupReporting(GR)核心模块功能及数据流向的架构解析，涵盖核心组件、数据处理流程和关键集成点，适用于S/4HANA1809+版本：一、核心功能模块概览模块功能关键事务码/FioriApp数据采集(DataCollection)整合子公司财务数据（SAP/非SA
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
深入解析JVM工作原理：从字节码到机器指令的全过程
一、JVM概述Java虚拟机(JVM)是Java平台的核心组件，它实现了Java"一次编写，到处运行"的理念。JVM是一个抽象的计算机器，它有自己的指令集和运行时内存管理机制。JVM的主要职责：加载：读取.class文件并验证其正确性存储：管理内存分配和垃圾回收执行：解释或编译字节码为机器指令安全：提供沙箱环境限制恶意代码二、JVM架构详解JVM由三个主要子系统组成：1.类加载子系统类加载过程分为
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
ARM 和 AMD 架构的区别 m0_69576880 arm开发 windows 架构
ARM架构和AMD架构是两种不同的计算机处理器架构，它们有以下几个主要区别：设计出发点、兼容性、性能特点、市场定价。设计出发点：①ARM构架：ARM架构最初是为嵌入式系统设计的，旨在提供低功耗和高效能的解决方案。它主要应用于移动设备、嵌入式系统和物联网设备②AMD架构：AMD架构是基于x86架构的扩展，旨在提供与Intel架构兼容的处理器。它主要用于台式机、服务器和工作站等计算机系统。兼容性：AR
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
Flowable 高级扩展：自定义元素与性能优化实战练习时长两年半的程序员小胡 Flowable 流程引擎实战指南流程图 flowable BPMN 流程引擎 java
在前五篇文章中，我们从基础概念、流程设计、API实战、SpringBoot集成，到外部系统协同，逐步构建了Flowable的应用体系。但企业级复杂场景中，原生功能往往难以满足定制化需求——比如需要特殊的审批规则网关、与决策引擎联动实现动态路由，或是在高并发场景下优化流程引擎性能。本文将聚焦Flowable的高级扩展能力，详解如何自定义流程元素、集成规则引擎，并掌握大型系统中的性能调优策略。一、自定
SpringMVC的执行流程
1、什么是MVCMVC是一种设计模式。MVC的原理图如下所示M-Model模型（完成业务逻辑：有javaBean构成，service+dao+entity）V-View视图（做界面的展示jsp，html……）C-Controller控制器（接收请求—>调用模型—>根据结果派发页面2、SpringMVC是什么SpringMVC是一个MVC的开源框架，SpringMVC=Struts2+Spring，
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
车载刷写架构 --- 整车刷写中为何增加了ECU 队列刷写策略？汽车电子实验室电子电器架构——刷写方案车载电子电气架构架构开发语言车载诊断进阶篇汽车中央控制单元HPC软件架构关于网关转发性能引起的思考
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：周末洗了一个澡，换了一身衣服，出了门却不知道去哪儿，不知道去找谁，漫无目的走着，大概这就是成年人最深的孤独吧!旧人不知我近况，新人不知我过往，近况不该旧人知，过往不与新人讲。纵你阅人何其多，再无一人恰似我。时间不知不觉中，来到新的一年。2025开始新的忙碌。成年人的我也不知道去哪里渡
车载诊断架构 ---面向售后的DTC应该怎么样填写？汽车电子实验室车载电子电气架构漫谈UDS诊断协议系列 EV（电动汽车）常规知识必备架构面向售后的DTC 车载诊断架构 OEM怎么掌握软件开发能力车载通信网络槪述 android ZEVonUDS-J1979
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：简单，单纯，喜欢独处，独来独往，不易合同频过着接地气的生活，除了生存温饱问题之外，没有什么过多的欲望，表面看起来很高冷，内心热情，如果你身边有这样灵性的人，一定要好好珍惜他们眼中有神有光，干净，给人感觉很舒服，有超强的感知能力有形的无形的感知力很强，能感知人的内心变化喜欢独处，好静，
车载诊断架构 --- 关于诊断时间参数P4的浅析汽车电子实验室车载电子电气架构漫谈UDS诊断协议系列架构开发语言关于网关转发性能引起的思考汽车中央控制单元HPC软件架构车载诊断进阶篇
关于诊断时间参数P4的浅析我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：所谓鸡汤，要么蛊惑你认命，要么怂恿你拼命，但都是回避问题的根源，以现象替代逻辑，以情绪代替思考，把消极接受现实的懦弱，伪装成乐观面对不幸的豁达，往不幸上面喷“香水”来掩盖问题。无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事.而不是让内心的烦
车载刷写架构 --- 刷写思考扩展汽车电子实验室电子电器架构——刷写方案架构开发语言关于网关转发性能引起的思考汽车中央控制单元HPC软件架构车载诊断进阶篇
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：做到欲望极简，了解自己的真实欲望，不受外在潮流的影响，不盲从，不跟风。把自己的精力全部用在自己。一是去掉多余，凡事找规律，基础是诚信；二是系统思考、大胆设计、小心求证；三是“一张纸制度”，也就是无论多么复杂的工作内容，要在一张纸上描述清楚；四是要坚决反对虎头蛇尾，反对繁文缛节，反对老
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
深入理解汇编语言子程序设计与系统调用网安spinage 汇编语言开发语言汇编算法
本文将全面解析汇编语言中子程序设计的核心技术以及系统调用的实现方法，涵盖参数传递的多种方式、堆栈管理、API调用等关键知识点，并提供实际案例演示。一、子程序设计：参数传递的艺术1.寄存器传参：高效简洁.386.modelflat,stdcalloptioncasemap:none.dataxdd5;定义变量ydd6sumdd?.code;函数定义：addxy1addxy1procpushebpmo
今晚吃太饱了爱伤心的蚂蚁
今晚吃太饱了，两碗干饭，两碗肉汤，一碗牛奶银耳汤，感觉肚子都顶出来了，圆滚滚的！明早要早起，出发去小蚂蚁家！看着剩下的肉汤，倒掉多可惜，干掉了！看着小蚂蚁熬的银耳汤，倒掉多可惜，于是热了一下，顺便热袋牛奶倒进去，大娃喝点，小蚂蚁喝点，还剩下一大碗，继续干掉！吃的太饱，人也懒洋洋的，躺床上不想动，感受的肚子撑撑的感觉，好久没吃这么饱了！这一晚灌的都是汤汤水水的，天冷的晚上，半夜要睡不安稳咯！哈哈！小
你对待万事万物的态度行靜
昨晚爸爸把洒水壶灌满水，对我说：你也该去浇浇你阳台上的花咯。这么大的天气，几天没浇水都快死了。我才意识到自己容易突然间忽视一些事情。尤其是身旁的一些事，可能它们呆久了，反而习以为常。想想每天的生活状态就是在不断的重复着一些事，有点固定模式。没有什么特别发生。记录我的一天：上班，挤公交，用手机或电脑，吃饭，上课。没有
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
基于redis的Zset实现作者的轻量级排名周童學 Java redis 数据库缓存
基于redis的Zset实现轻量级作者排名系统在今天的技术架构中，Redis是一种广泛使用的内存数据存储系统，尤其在需要高效检索和排序的场景中表现优异。在本篇博客中，我们将深入探讨如何使用Redis的有序集合（ZSet）构建一个高效的笔记排行榜系统，并提供相关代码示例和详细的解析。1.功能背景与需求假设我们有一个笔记分享平台，用户可以发布各种笔记，系统需要根据用户发布的笔记数量来生成一个实时更新的
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe