AI云原生与云计算技术学院

微服务架构监控：四大黄金指标解析

关键词：微服务架构、监控体系、四大黄金指标、SRE、延迟、流量、错误、饱和度

摘要：本文深入解析微服务架构监控的核心方法论——四大黄金指标（延迟、流量、错误、饱和度），基于Google SRE最佳实践，结合具体技术实现与数学模型，阐述指标设计原理、数据采集方法、可视化实践及异常诊断逻辑。通过完整的项目实战案例，演示如何构建端到端监控体系，帮助技术团队建立可观测性基线，提升分布式系统稳定性。

1. 背景介绍

1.1 目的和范围

随着微服务架构的普及，分布式系统的复杂度呈指数级增长。服务间依赖关系的碎片化、流量模式的动态变化、故障传播的不可预测性，对传统监控体系提出严峻挑战。本文聚焦Google SRE提出的四大黄金指标（Four Golden Signals），系统讲解其在微服务监控中的应用框架，涵盖指标定义、数据采集、阈值设定、异常响应全流程，帮助技术团队建立标准化的监控度量体系。

1.2 预期读者

微服务架构师与开发者
SRE（站点可靠性工程师）与运维团队
分布式系统性能优化相关技术人员

1.3 文档结构概述

核心概念：解析四大黄金指标的定义与相互关系，构建监控指标矩阵
技术实现：基于Prometheus/Grafana生态，演示指标采集与可视化落地
数学模型：推导延迟百分位数、错误率计算等核心公式
实战案例：搭建包含三个微服务的演示系统，实现端到端监控闭环
扩展应用：讨论指标在容量规划、故障根因分析中的高阶应用

1.4 术语表

1.4.1 核心术语定义

微服务（Microservices）：将单体应用拆分为独立部署的小型服务，通过API通信的架构模式
SRE（Site Reliability Engineering）：Google提出的融合软件开发与运维的可靠性工程方法论
四大黄金指标：
- 延迟（Latency）：服务处理请求的耗时，区分成功请求与失败请求的延迟
- 流量（Traffic）：衡量服务负载的指标，如HTTP请求数、数据库连接数等
- 错误（Errors）：请求失败的数量，分为显式错误（如HTTP 5xx）和隐式错误（如业务逻辑异常）
- 饱和度（Saturation）：系统资源利用率的度量，通常关注CPU、内存、队列长度等

1.4.2 相关概念解释

百分位数（Percentile）：用于描述数据分布的统计量，如p99表示99%的请求延迟低于该值
服务等级目标（SLO）：对服务性能和可靠性的量化承诺，如"99.9%的请求在200ms内响应"
服务等级协议（SLA）：基于SLO与客户签订的正式协议，包含违约补偿条款

1.4.3 缩略词列表

缩写	全称
HTTP	超文本传输协议（HyperText Transfer Protocol）
API	应用程序接口（Application Programming Interface）
QPS	每秒查询数（Queries Per Second）
RT	响应时间（Response Time）
TPS	每秒事务数（Transactions Per Second）

2. 核心概念与联系

2.1 四大黄金指标的设计哲学

四大黄金指标的核心价值在于提供统一的监控语言，使不同角色（开发、运维、产品）能够基于标准化指标进行沟通。其设计遵循以下原则：

业务相关性：直接反映服务对用户的价值，如延迟影响用户体验，错误率影响服务可信度
可观测性基础：覆盖服务的输入（流量）、处理过程（延迟）、输出结果（错误）、资源消耗（饱和度）
故障预判能力：饱和度指标可提前预警系统过载，避免连锁故障

2.2 指标间的依赖关系

四大指标并非孤立存在，而是通过服务处理流程紧密关联。下图展示了典型HTTP请求处理路径中的指标映射关系：

是

否

客户端请求

负载均衡

服务实例

处理成功?

返回200 OK

返回5xx错误

记录延迟数据

系统资源

流量指标

错误指标

延迟指标

饱和度指标

2.3 指标分类与应用场景

指标类型	度量对象	核心作用	常见单位	观测维度
流量	输入负载	容量规划、流量突增预警	QPS/TPS	总量、速率、峰值
延迟	处理耗时	性能瓶颈定位、用户体验评估	ms/μs	平均值、p95、p99
错误	失败请求	服务可用性保障、故障诊断	数量、比率	绝对数、错误率
饱和度	资源利用	过载保护、弹性伸缩触发	%、队列长度	CPU/内存使用率、连接池占用

3. 核心算法原理 & 具体操作步骤

3.1 延迟指标计算（百分位数算法）

延迟指标的难点在于处理长尾效应，平均值无法准确反映极端情况，因此需采用百分位数。常用算法包括：

3.1.1 线性插值法（Linear Interpolation）

假设有序数组X = [x1, x2, ..., xn]，计算第p百分位数步骤：

确定排名r = p/100 * (n-1) + 1
整数部分k = floor(r)，小数部分d = r - k
结果为x_k + d*(x_{k+1} - x_k)

Python实现：

def calculate_percentile(data, p):
    data_sorted = sorted(data)
    n = len(data_sorted)
    r = (p / 100) * (n - 1) + 1
    k = int(r)
    d = r - k
    if k == 1:
        return data_sorted[0]
    elif k == n:
        return data_sorted[-1]
    else:
        return data_sorted[k-1] + d * (data_sorted[k] - data_sorted[k-1])

3.1.2 等频分桶法（用于大规模数据实时计算）

在Prometheus中，通过histogram_quantile函数计算百分位数，底层采用t-digest算法进行近似计算，适合高基数实时数据。

3.2 错误指标分类与计算

错误分为两类：

显式错误：协议级错误（如HTTP 4xx/5xx，RPC调用失败）
隐式错误：业务逻辑错误（如订单创建失败，数据校验不通过）

错误率计算公式：
$\frac{错误请求数}{总请求数} \times 100\%$

Python示例（HTTP服务器错误统计）：

class RequestMetrics:
    def __init__(self):
        self.total_requests = 0
        self.error_requests = 0
    
    def record_success(self):
        self.total_requests += 1
    
    def record_error(self, status_code):
        if status_code >= 400:
            self.error_requests += 1
            self.total_requests += 1
    
    def get_error_rate(self):
        if self.total_requests == 0:
            return 0.0
        return self.error_requests / self.total_requests

3.3 饱和度指标的资源建模

饱和度监控需结合具体资源类型设计指标：

CPU：使用率（user/system/idle时间占比）、平均负载（load average）
内存：可用内存、缓存命中率、swap使用量
网络：带宽利用率、TCP连接数、队列长度
存储：磁盘IOPS、吞吐量、inode利用率

关键公式：
$\frac{idle时间}{总时间}) \times 100\%$
$\frac{当前队列长度}{队列容量}$

4. 数学模型和公式 & 详细讲解 & 举例说明

4.1 延迟分布的统计特性

假设某服务处理10个请求的延迟（ms）为：[10, 15, 20, 25, 30, 35, 40, 45, 50, 1000]

平均值： $xˉ=10+15+...+100010=127ms\bar{x} = \frac{10+15+...+1000}{10} = 127 ms$
p90百分位数：第9个数据点为50ms（排序后第90%位置）
p99百分位数：通过线性插值计算，n=10，r=0.999+1=9.91，k=9，d=0.91，结果=50+0.91(1000-50)=955.5ms

结论：平均值受异常值影响大，百分位数能更真实反映大多数请求的延迟情况。

4.2 错误预算模型（Error Budget）

根据SRE理论，服务可用性目标对应错误预算。例如：

目标可用性99.9%（每月允许43.2分钟停机）
错误预算 = 总时间 × (1 - 目标可用性)

公式推导：
$\times (1 - SLO)$
其中，T为统计周期，SLO为目标可用性（如0.999）

4.3 饱和度与服务降级策略

当CPU饱和度超过80%时，触发服务降级逻辑：

关闭非核心功能（如图片实时处理降级为异步处理）
限制并发请求数（通过令牌桶算法）
返回缓存数据替代实时计算

令牌桶算法公式：

令牌生成速率：r tokens/sec
令牌桶容量：b tokens
允许突发请求数：不超过b tokens

5. 项目实战：代码实际案例和详细解释说明

5.1 开发环境搭建

5.1.1 技术栈选择

微服务框架：Python Flask
服务注册：Consul
指标采集：Prometheus + Prometheus Python Client
可视化：Grafana
服务调用：HTTP客户端（Requests库）

5.1.2 环境部署

安装Docker和Docker Compose

启动Consul容器：

docker run -d -p 8500:8500 --name=consul consul agent -dev -client=0.0.0.0

启动Prometheus（配置文件prometheus.yml）：

global:
  scrape_interval: 15s
scrape_configs:
  - job_name: 'microservices'
    consul_sd_configs:
      - server: 'consul:8500'
    relabel_configs:
      - source_labels: [__meta_consul_tags]
        regex: .*monitor=true.*
        action: keep

5.2 源代码详细实现

5.2.1 公共指标模块（metrics.py）

from prometheus_client import (
    Counter, Histogram, generate_latest, CollectorRegistry
)

# 流量指标：总请求数
REQUEST_COUNTER = Counter(
    'http_requests_total',
    'Total number of HTTP requests',
    ['method', 'endpoint', 'status']
)

# 延迟指标：响应时间直方图（单位：秒）
LATENCY_HISTOGRAM = Histogram(
    'http_response_time_seconds',
    'Histogram of HTTP response times',
    ['method', 'endpoint']
)

# 错误指标：显式错误计数器
ERROR_COUNTER = Counter(
    'http_errors_total',
    'Total number of error responses',
    ['method', 'endpoint', 'status']
)

5.2.2 用户服务（user-service）

from flask import Flask, jsonify
import requests
from metrics import REQUEST_COUNTER, LATENCY_HISTOGRAM, ERROR_COUNTER

app = Flask(__name__)

@app.route('/users/', methods=['GET'])
@LATENCY_HISTOGRAM.time()  # 自动记录请求耗时
def get_user(user_id):
    method = 'GET'
    endpoint = '/users/'
    REQUEST_COUNTER.labels(method, endpoint, '200').inc()
    
    try:
        # 模拟调用订单服务
        order_response = requests.get(f'http://order-service:5001/orders/{user_id}')
        order_response.raise_for_status()
    except requests.exceptions.HTTPError as e:
        ERROR_COUNTER.labels(method, endpoint, str(e.response.status_code)).inc()
        return jsonify({'error': 'Order service error'}), e.response.status_code
    
    return jsonify({'user_id': user_id, 'status': 'ok'}), 200

5.2.3 指标暴露端点

每个服务添加指标获取接口：

@app.route('/metrics')
def metrics():
    return generate_latest(), 200, {'Content-Type': 'text/plain; charset=utf-8'}

5.3 代码解读与分析

指标关联：通过labels参数为每个指标添加维度（method、endpoint、status），支持多维查询
自动计时：使用Histogram.time()装饰器自动记录请求处理时间，避免手动埋点误差
错误捕获：在HTTP调用层统一捕获异常，区分服务间调用错误与本地处理错误
服务发现：通过Consul注册服务，Prometheus动态获取监控目标

6. 实际应用场景

6.1 电商促销活动中的流量峰值应对

流量指标：实时监控API网关QPS，设置动态扩容阈值（如QPS超过5000时增加实例）
延迟指标：监控p99延迟，当超过500ms时触发CDN静态资源缓存
错误指标：区分库存服务超时（504 Gateway Timeout）与支付网关拒绝（403 Forbidden），针对性熔断
饱和度指标：监控数据库连接池饱和度，达到80%时拒绝新连接并返回限流响应

6.2 金融交易系统的错误率管控

显式错误：对交易接口的4xx/5xx错误率设置严格SLO（如<0.01%）
隐式错误：通过业务日志监控交易失败事件（如账户余额不足），计入自定义错误指标
延迟敏感：核心交易路径的p99延迟需控制在200ms以内，超过时触发异步处理降级

6.3 实时数据处理平台的资源调度

CPU饱和度：基于YARN集群的节点CPU使用率（超过90%时触发任务迁移）
队列饱和度：Kafka主题分区的堆积量（超过10万条时增加消费者实例）
流量波动：根据输入topic的TPS动态调整处理节点数，实现自动扩缩容

7. 工具和资源推荐

7.1 学习资源推荐

7.1.1 书籍推荐

《Site Reliability Engineering》- Google SRE团队合著，四大黄金指标的权威出处
《Observability in Microservices》- 深入讲解分布式系统可观测性，包含指标设计最佳实践
《Performance Engineering of Software Systems》- 系统性能分析的数学模型与工程方法

7.1.2 在线课程

Coursera《Microservices Architecture Specialization》- 包含监控与容错模块
Udemy《Prometheus and Grafana for Monitoring Microservices》- 实战导向的工具使用课程
edX《Principles of SRE》- Google Cloud官方课程，涵盖黄金指标与错误预算

7.1.3 技术博客和网站

Google Cloud SRE博客：https://sre.google/
Prometheus官方文档：https://prometheus.io/docs/
Grafana Labs博客：https://grafana.com/blog/

7.2 开发工具框架推荐

7.2.1 IDE和编辑器

IntelliJ IDEA：支持微服务架构调试，集成Prometheus插件
VS Code：轻量级编辑器，推荐安装Prometheus语法高亮插件
PyCharm：Python微服务开发首选，支持Docker集成调试

7.2.2 调试和性能分析工具

Jaeger/Zipkin：分布式追踪系统，关联指标与调用链
Grafana Tempo：开源分布式追踪存储，与Grafana深度集成
pprof：Go语言内置性能分析工具，支持CPU/内存/阻塞操作 profiling

7.2.3 相关框架和库

OpenTelemetry：统一的可观测性标准，支持指标、日志、追踪数据采集
Prometheus Client Libraries：支持30+编程语言的官方指标库
Grafana Loki：轻量级日志聚合系统，与Prometheus无缝集成

7.3 相关论文著作推荐

7.3.1 经典论文

《The Four Golden Signals of Monitoring》- Google SRE白皮书核心章节
《百分位数在大规模系统监控中的应用》- 探讨p99指标的工程实现挑战
《分布式系统中的饱和度管理》- 提出基于队列理论的资源调度模型

7.3.2 最新研究成果

《AI-Driven Anomaly Detection in Microservices using Golden Signals》- 结合机器学习的异常检测算法
《Serverless架构下的黄金指标扩展》- 讨论无服务器环境中指标定义的适应性调整

7.3.3 应用案例分析

《Netflix微服务监控体系演进》- 大规模分布式系统中的指标优化实践
《Spotify基于黄金指标的SLO管理》- 音乐流媒体场景下的实时监控方案

8. 总结：未来发展趋势与挑战

8.1 技术趋势

全链路可观测性：指标与日志、追踪数据的深度融合，实现从用户请求到底层资源的端到端关联
智能监控系统：基于机器学习的动态阈值调整（如异常检测、容量预测），减少人工配置成本
边缘计算场景适配：在资源受限环境中优化指标采集策略，平衡数据精度与性能开销

8.2 核心挑战

多维度数据融合：如何在微服务网格（如Istio）中统一不同协议（HTTP/gRPC/消息队列）的指标定义
动态阈值设定：处理流量模式频繁变化（如Serverless架构冷启动）时的指标基线漂移问题
跨团队协作：建立统一的指标规范，解决开发、测试、运维团队对指标理解的不一致性

8.3 实施建议

从核心服务开始：优先在用户可见的关键路径服务中落地四大指标，逐步扩展到全链路
建立指标字典：维护包含指标定义、采集方式、负责人、SLO的统一管理平台
持续迭代优化：根据故障复盘结果，定期评估指标体系的有效性，调整监控策略

9. 附录：常见问题与解答

Q1：为什么选择四大黄金指标而非其他监控指标？

A：四大指标覆盖了服务的核心维度，且与Google SRE方法论深度整合，提供了可落地的监控框架。相比自定义指标，其标准化程度更高，便于跨团队协作。

Q2：如何处理不同服务间指标维度的不一致？

A：通过OpenTelemetry等标准化协议统一指标维度定义，例如所有HTTP服务使用相同的method、endpoint标签，数据库服务统一database、operation标签。

Q3：百分位数计算的性能开销如何？

A：对于实时计算，推荐使用近似算法（如t-digest、HdrHistogram），在精度（误差<1%）和性能之间取得平衡，Prometheus等工具已内置高效实现。

Q4：饱和度指标的阈值如何设定？

A：需结合服务特性：无状态服务可设置较高CPU阈值（如80%），有状态服务（如数据库）建议控制在60%以下。建议通过压测确定服务的最大容量拐点。

10. 扩展阅读 & 参考资料

Google SRE官方文档：https://sre.google/docs/
Prometheus最佳实践：https://prometheus.io/docs/practices/
微服务监控白皮书（CNCF）：https://www.cncf.io/wp-content/uploads/2020/09/Microservices-Monitoring-Whitepaper.pdf

通过系统化应用四大黄金指标，技术团队能够建立兼具通用性与针对性的监控体系，将复杂分布式系统的运行状态转化为可量化、可分析、可行动的洞察。随着微服务架构向云原生、边缘计算等领域延伸，指标体系需持续演进，与服务网格、无服务器等新技术栈深度融合，最终实现从被动监控到主动可靠性管理的跨越。

x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
（二）SAP Group Reporting (GR) 核心子模块功能及数据流向架构解析
数据如何从子公司流转到合并报表的全过程，即数据采集→合并引擎→报表输出，特别是HANA内存计算如何优化传统ETL瓶颈。SAPGroupReporting(GR)核心模块功能及数据流向的架构解析，涵盖核心组件、数据处理流程和关键集成点，适用于S/4HANA1809+版本：一、核心功能模块概览模块功能关键事务码/FioriApp数据采集(DataCollection)整合子公司财务数据（SAP/非SA
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
深入解析JVM工作原理：从字节码到机器指令的全过程
一、JVM概述Java虚拟机(JVM)是Java平台的核心组件，它实现了Java"一次编写，到处运行"的理念。JVM是一个抽象的计算机器，它有自己的指令集和运行时内存管理机制。JVM的主要职责：加载：读取.class文件并验证其正确性存储：管理内存分配和垃圾回收执行：解释或编译字节码为机器指令安全：提供沙箱环境限制恶意代码二、JVM架构详解JVM由三个主要子系统组成：1.类加载子系统类加载过程分为
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
ARM 和 AMD 架构的区别 m0_69576880 arm开发 windows 架构
ARM架构和AMD架构是两种不同的计算机处理器架构，它们有以下几个主要区别：设计出发点、兼容性、性能特点、市场定价。设计出发点：①ARM构架：ARM架构最初是为嵌入式系统设计的，旨在提供低功耗和高效能的解决方案。它主要应用于移动设备、嵌入式系统和物联网设备②AMD架构：AMD架构是基于x86架构的扩展，旨在提供与Intel架构兼容的处理器。它主要用于台式机、服务器和工作站等计算机系统。兼容性：AR
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
车载刷写架构 --- 整车刷写中为何增加了ECU 队列刷写策略？汽车电子实验室电子电器架构——刷写方案车载电子电气架构架构开发语言车载诊断进阶篇汽车中央控制单元HPC软件架构关于网关转发性能引起的思考
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：周末洗了一个澡，换了一身衣服，出了门却不知道去哪儿，不知道去找谁，漫无目的走着，大概这就是成年人最深的孤独吧!旧人不知我近况，新人不知我过往，近况不该旧人知，过往不与新人讲。纵你阅人何其多，再无一人恰似我。时间不知不觉中，来到新的一年。2025开始新的忙碌。成年人的我也不知道去哪里渡
车载诊断架构 ---面向售后的DTC应该怎么样填写？汽车电子实验室车载电子电气架构漫谈UDS诊断协议系列 EV（电动汽车）常规知识必备架构面向售后的DTC 车载诊断架构 OEM怎么掌握软件开发能力车载通信网络槪述 android ZEVonUDS-J1979
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：简单，单纯，喜欢独处，独来独往，不易合同频过着接地气的生活，除了生存温饱问题之外，没有什么过多的欲望，表面看起来很高冷，内心热情，如果你身边有这样灵性的人，一定要好好珍惜他们眼中有神有光，干净，给人感觉很舒服，有超强的感知能力有形的无形的感知力很强，能感知人的内心变化喜欢独处，好静，
车载诊断架构 --- 关于诊断时间参数P4的浅析汽车电子实验室车载电子电气架构漫谈UDS诊断协议系列架构开发语言关于网关转发性能引起的思考汽车中央控制单元HPC软件架构车载诊断进阶篇
关于诊断时间参数P4的浅析我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：所谓鸡汤，要么蛊惑你认命，要么怂恿你拼命，但都是回避问题的根源，以现象替代逻辑，以情绪代替思考，把消极接受现实的懦弱，伪装成乐观面对不幸的豁达，往不幸上面喷“香水”来掩盖问题。无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事.而不是让内心的烦
车载刷写架构 --- 刷写思考扩展汽车电子实验室电子电器架构——刷写方案架构开发语言关于网关转发性能引起的思考汽车中央控制单元HPC软件架构车载诊断进阶篇
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：做到欲望极简，了解自己的真实欲望，不受外在潮流的影响，不盲从，不跟风。把自己的精力全部用在自己。一是去掉多余，凡事找规律，基础是诚信；二是系统思考、大胆设计、小心求证；三是“一张纸制度”，也就是无论多么复杂的工作内容，要在一张纸上描述清楚；四是要坚决反对虎头蛇尾，反对繁文缛节，反对老
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
基于redis的Zset实现作者的轻量级排名周童學 Java redis 数据库缓存
基于redis的Zset实现轻量级作者排名系统在今天的技术架构中，Redis是一种广泛使用的内存数据存储系统，尤其在需要高效检索和排序的场景中表现优异。在本篇博客中，我们将深入探讨如何使用Redis的有序集合（ZSet）构建一个高效的笔记排行榜系统，并提供相关代码示例和详细的解析。1.功能背景与需求假设我们有一个笔记分享平台，用户可以发布各种笔记，系统需要根据用户发布的笔记数量来生成一个实时更新的
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
Redis + Caffeine 实现高效的两级缓存架构周童學 Java 缓存 redis 架构
Redis+Caffeine实现高效的两级缓存架构引言在现代高并发系统中，缓存是提升系统性能的关键组件之一。传统的单一缓存方案往往难以同时满足高性能和高可用性的需求。本文将介绍如何结合Redis和Caffeine构建一个高效的两级缓存系统，并通过三个版本的演进展示如何逐步优化代码结构。项目源代码：github地址、gitee地址两级缓存架构概述两级缓存通常由本地缓存（如Caffeine）和分布式缓
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
严重的DDoS 攻击澳大利亚主要宽带提供商 Fancy1816575412
本周早些时候，澳大利亚最大的固定无线宽带运营商CirrusCommunications遭受了一次重大的DDoS攻击，导致其一半以上的网络瘫痪。该公司在其网站上声称：“强大的架构、数百个传输站点以及光纤和微波回程的使用使其能够以非常高的正常运行时间提供高速”。CirrusCommunications表示，它覆盖了澳大利亚十大人口中心以及几个主要的区域中心，主要为企业和政府客户提供服务。然而，据The
Selenium 特殊控件操作与 ActionChains 实践详解小馋喵知识杂货铺 selenium 测试工具
1.下拉框单选操作(a)使用SeleniumSelect类（标准HTML标签）Selenium提供了内置的Select类用于操作标准下拉框，这种方式简单且直观。fromselenium.webdriver.support.uiimportSelect#定位下拉框dropdown=Select(driver.find_element("id","dropdown_id"))#通过以下三种方式选择单个
深入理解 Tomcat Wrapper 原理北漂老男人 Tomcat tomcat java
深入理解TomcatWrapper原理一、引言在Tomcat的分层容器架构中，Wrapper作为最底层的容器，专门负责管理单个Servlet的生命周期及请求分发。每一个Servlet（包括JSP、Filter等）都对应一个Wrapper。Wrapper是Servlet规范与Tomcat容器实现之间的桥梁，直接关系到请求的分发效率、Servlet的加载与重用、安全隔离等。本文将系统剖析Wrapper
分布式链路追踪系统架构设计：从理论到企业级实践 ma451152002 java 分布式系统架构
分布式链路追踪系统架构设计：从理论到企业级实践本文深入探讨分布式链路追踪系统的架构设计原理、关键技术实现和企业级应用实践，为P7架构师提供完整的技术方案参考。目录引言：分布式链路追踪的重要性核心概念与技术原理系统架构设计数据模型与协议标准核心组件架构设计性能优化与扩展性设计企业级实施策略技术选型与对比分析监控与运维体系未来发展趋势P7架构师面试要点引言：分布式链路追踪的重要性微服务架构下的挑战在现
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具文章来源：PoixeAI文章目录Zread.AI工具概述核心功能优势亮点典型应用场景上手指南注意事项官网地址Zread.AI由智谱Z.ai推出，是一款面向开发者的AI代码维基工具，可在几秒内把任何公开GitHub仓库转化为结构化中文手册，并通过独家Buzz面板聚合commits、issues与相关新闻，让项目脉搏一目了然
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite

微服务架构监控：四大黄金指标解析