庸子

Prometheus 基础入门文档

概述

核心组件详解

Prometheus Server

Exporters

Alertmanager

存储解决方案

安装与配置

安装方法

基本配置

示例配置文件

数据模型与查询语言

数据模型

PromQL 查询语言

示例查询

告警系统

告警规则

示例告警规则

Alertmanager 配置

示例 Alertmanager 配置文件

集成与可视化

与 Grafana 集成

配置步骤

与 Kubernetes 集成

示例 Kubernetes 配置

其他集成

性能优化与高可用

性能优化

高可用架构

联邦集群配置示例

安全配置

示例安全配置

概述

Prometheus 是一个开源的监控和告警系统，最初由 SoundCloud 公司开发，现在由 Cloud Native Computing Foundation (CNCF) 维护。作为一个专为云原生环境设计的监控系统，Prometheus 在容器化和微服务架构中表现出色。它通过从被监控目标的指标HTTP端点抓取指标来收集数据，具有多维数据模型、灵活查询语言、高效时序数据库和现代化告警方法等特点。

Prometheus 的核心组件包括服务器（Server）、告警管理器（Alertmanager）、各种导出器（Exporter）以及存储解决方案。作为一个开源项目，Prometheus 拥有活跃的社区支持和丰富的生态系统，与 Kubernetes、Grafana 等工具深度集成，为现代 IT 基础设施提供了全面的监控解决方案。

核心组件详解

Prometheus Server

Prometheus Server 是 Prometheus 组件中的核心部分，负责实现对监控数据的获取、存储以及查询。它通过 HTTP 协议从各种数据源中抓取指标数据，并将这些数据存储在本地的时间序列数据库（TSDB）中。Prometheus Server 可以通过静态配置管理监控目标，也可以配合服务发现机制动态发现监控目标。

Prometheus Server 的主要功能包括：

数据采集：通过 HTTP 协议从各种 Exporter 拉取指标数据
数据存储：使用本地时间序列数据库存储监控数据
数据查询：提供灵活的 PromQL 查询语言进行数据查询和分析
告警规则：定义告警触发条件，当条件满足时触发告警
配置管理：通过 YAML 配置文件管理监控任务和告警规则

Exporters

Exporters 是一类将各种系统和应用的指标数据暴露为 Prometheus 可以抓取的 HTTP 服务的工具。它们负责收集被监控系统的指标数据，并将其转换为 Prometheus 标准格式。常见的 Exporters 包括：

Node Exporter：监控 Linux 主机的系统资源使用情况，如 CPU、内存、磁盘和网络等
Process Exporter：监控进程的资源使用情况
MySQL Exporter：监控 MySQL 数据库的运行状态
Blackbox Exporter：用于网络探测，如 HTTP、DNS、TCP 等服务的可达性测试
Kubernetes Exporter：监控 Kubernetes 集群的资源使用情况

Alertmanager

Alertmanager 是 Prometheus 的告警管理组件，负责处理 Prometheus 生成的告警信息。它接收来自 Prometheus 的告警通知，并根据配置的路由规则将告警发送到指定的通知渠道（如邮件、Slack、钉钉等）。Alertmanager 的主要功能包括：

告警路由：根据告警标签将告警路由到不同的通知渠道
抑制重复告警：防止在短时间内重复发送相同的告警
告警分组：将相关的告警信息分组发送
延迟抑制：在指定的时间段内抑制告警通知

存储解决方案

Prometheus 提供了多种存储解决方案，以满足不同的数据持久化需求：

本地存储：使用默认的本地时间序列数据库存储监控数据
远程存储：将监控数据写入远程存储系统，如 Amazon S3、Google Cloud Storage 等
联邦集群：通过联邦机制将监控数据聚合到一个中心 Prometheus 实例中

安装与配置

安装方法

Prometheus 提供了多种安装方式，以适应不同的环境和需求：

二进制文件安装：
- 从 Prometheus 官方网站下载对应操作系统的二进制包
- 解压后即可使用，这是最直接的安装方式，适合对环境有充分控制权的用户
Docker 容器安装：
- 使用官方提供的 Prometheus 和 Alertmanager 镜像
- 适合在容器化环境中部署
Kubernetes 集群安装：
- 使用官方提供的 Helm Chart 或 YAML 配置文件
- 适合在 Kubernetes 集群中部署

基本配置

Prometheus 的核心配置文件是 prometheus.yml，主要包含以下部分：

Global 配置：定义全局配置参数，如时间格式、时区等
Scrape_configs：定义监控任务，包括目标地址、抓取间隔、标签等
Rule_files：定义告警规则文件路径
Remote_write：配置远程存储，指定远程存储的地址和配置
Federation：配置联邦集群，指定需要聚合的 Prometheus 实例

示例配置文件

global:
  scrape_interval: 15s
  scrape_timeout: 10s
  evaluation_interval: 15s

scrape_configs:
  - job_name: 'prometheus'
    scrape_interval: 5s
    static_configs:
      - targets: ['localhost:9090']

  - job_name: 'node_exporter'
    scrape_interval: 5s
    static_configs:
      - targets: ['localhost:9100']

alerting:
  alertmanagers:
    - static_configs:
        - targets: ['localhost:9093']

rule_files:
  - alert.rules

数据模型与查询语言

数据模型

Prometheus 的数据模型基于多维时间序列，每个时间序列由以下部分组成：

指标名称：标识监控的指标名称
时间戳：记录指标数据采集的时间
值：记录指标数据的数值
标签：一组键值对，用于标识时间序列的维度信息

Prometheus 支持多种类型的指标，包括：

计数器：只能增加的数值，如请求数量
计时器：记录时间的数值，如请求处理时间
直方图：记录数值分布的统计信息，如请求处理时间分布
摘要：记录数值分布的统计摘要，如请求数、平均值、中位数等

PromQL 查询语言

PromQL（Prometheus Query Language）是 Prometheus 提供的查询语言，用于查询和分析时间序列数据。PromQL 支持以下主要操作：

选择操作：通过指标名称和标签选择时间序列数据
聚合操作：对时间序列数据进行聚合，如求和、平均、最大值等
函数操作：调用内置函数对时间序列数据进行处理
比较操作：对时间序列数据进行比较，如大于、小于、等于等

示例查询

查询所有 CPU 使用率：

sum by (instance) (node_cpu_seconds_total)

查询内存使用率：

(node_memory_used_bytes{unit="MiB"} / node_memory_total_bytes{unit="MiB"}) * 100

查询 HTTP 请求数量：

increase(http_requests_total[5m])

告警系统

告警规则

Prometheus 的告警规则允许你基于 PromQL 表达式定义告警触发条件。当 PromQL 表达式查询结果持续多长时间（During）后触发告警。告警规则文件是 YAML 文件，定义了告警条件和告警信息。

示例告警规则

groups:
  - name: example
    rules:
      - alert: High CPU Usage
        expr: (node_cpu_seconds_total{mode="user"} / node_cpu_seconds_total) * 100 > 90
        for: 5m
        labels:
          severity: critical
        annotations:
          summary: "High CPU Usage"
          description: "CPU usage is above 90% for more than 5 minutes."

Alertmanager 配置

Alertmanager 负责处理和分发告警信息。其配置文件主要包含以下部分：

Global 配置：定义全局参数，如通知渠道的默认参数
Route 配置：定义告警路由规则，根据告警标签将告警路由到不同的通知渠道
Inhibit 配置：定义抑制规则，防止在短时间内重复发送相同的告警
Receivers 配置：定义通知渠道，如邮件、Slack、钉钉等

示例 Alertmanager 配置文件

global:
  resolve_timeout: 5m

route:
  receiver: "email"
  routes:
    - match:
        severity: "critical"
      receiver: "slack"

receivers:
  - name: "email"
    email_configs:
      - to: "[email protected]"
        send_resolved: true

  - name: "slack"
    slack_configs:
      - channel: "#alerts"
        send_resolved: true

集成与可视化

与 Grafana 集成

Grafana 是一个流行的可视化工具，支持与 Prometheus 集成，提供丰富的监控仪表板和可视化效果。要将 Prometheus 与 Grafana 集成，需要在 Grafana 中添加 Prometheus 数据源。

配置步骤

在 Grafana 中点击左侧导航栏中的 “Data Sources”
点击 “Add data source”
选择 “Prometheus” 作为数据源类型
填写 Prometheus 服务器的 URL（默认为 http://localhost:9090）
点击 “Save & Test” 完成配置

与 Kubernetes 集成

Prometheus 提供了专门的 Kubernetes Exporter，用于监控 Kubernetes 集群的资源使用情况。在 Kubernetes 集群中部署 Prometheus 时，可以使用官方提供的 Helm Chart 或 YAML 配置文件。

示例 Kubernetes 配置

apiVersion: monitoring.coreos.com/v1
kind: ServiceMonitor
metadata:
  name: node-exporter
spec:
  selector:
    matchLabels:
      app: node-exporter
  endpoints:
    - port: http
      interval: 30s

其他集成

Prometheus 拥有丰富的生态系统，支持与多种工具和平台集成，包括：

Prometheus Operator：在 Kubernetes 集群中管理 Prometheus 实例
Thanos：提供 Prometheus 的长期数据存储和全局查询能力
Cortex：提供可扩展的 Prometheus 服务，支持大规模监控数据存储和查询

性能优化与高可用

性能优化

Prometheus 的性能优化主要关注减少资源消耗、提高查询效率和降低基数问题。以下是一些性能优化的最佳实践：

合理设置抓取间隔：根据监控需求设置合理的抓取间隔，避免频繁抓取导致资源消耗过高
配置数据保留策略：设置适当的数据保留时间，避免存储空间不足
优化标签使用：减少高基数标签的使用，避免内存消耗过高
使用联邦集群：将监控数据分散到多个 Prometheus 实例中，提高系统性能
配置远程存储：将历史数据存储到远程存储系统中，释放本地存储空间

高可用架构

为了提高 Prometheus 的可用性，可以采用以下高可用架构：

简单 HA 架构：部署多个 Prometheus 实例，每个实例具有相同的配置，通过负载均衡器对外提供服务
简单 HA + 远程存储：在简单 HA 架构的基础上，配置远程存储，将监控数据写入远程存储系统
联邦集群架构：部署多个 Prometheus 实例，通过联邦机制将监控数据聚合到一个中心 Prometheus 实例中

联邦集群配置示例

federate:
  - targets:
      - 'http://prometheus1:9090'
      - 'http://prometheus2:9090'

安全配置

Prometheus 提供了多种安全功能，用于保护监控数据和告警信息。以下是一些安全配置的最佳实践：

Basic Auth 验证：配置 Basic Auth 验证，限制对 Prometheus UI 和 API 的访问
TLS 加密：配置 TLS 加密，保护数据传输过程中的安全性
访问控制：配置访问控制列表，限制对特定监控数据和告警信息的访问
静默告警：配置静默告警，防止在指定时间段内发送告警信息

示例安全配置

security:
  auth:
    type: basic
    basic:
      users:
        - name: admin
          password: admin123

结语

Prometheus 是一个功能强大、灵活多变的监控和告警系统，适用于各种规模和复杂度的 IT 基础设施。通过合理配置和使用，Prometheus 可以帮助运维人员全面了解系统状态、及时发现潜在问题、优化系统性能和提高可用性。

随着技术的发展和用户需求的变化，Prometheus 也在不断演进和改进，提供更好的功能和性能。通过积极参与社区和生态系统，Prometheus 将继续引领监控领域的创新和发展。

零基础学习性能测试第九章：全链路追踪-系统中间件节点监控试着性能测试学习中间件性能测试零基础
目录一、为什么需要监控中间件节点？二、主流中间件监控方案1.监控体系架构2.监控工具矩阵三、环境搭建实战1.部署Prometheus2.部署Grafana四、中间件监控配置实战1.Nginx监控2.Redis监控3.Kafka监控4.MySQL监控五、全链路追踪中的中间件监控1.SkyWalking与Prometheus集成2.全链路视角的中间件监控六、性能瓶颈定位实战1.瓶颈分析流程图2.典型瓶
Flink实战（七十）：监控（二）搭建flink可视化监控 Pushgateway+ Prometheus + Grafana （windows ）王知无(import_bigdata) Flink系统性学习专栏 flink 大数据
1Flink的配置:在flink配置⽂件flink-conf.yaml中添加：metrics.reporter.promgateway.class:org.apache.flink.metrics.prometheus.PrometheusPushGatewayReportermetrics.reporter.promgateway.host:localhost#promgateway主要是Pus
基于Prometheus的flink性能监控小坑记录 darkness0604 flink 大数据 java 大数据 flink
背景公司内的flink集群跑了挺长一段时间了，一直也没有对其进行一个比较完整的监控，最近打算着手做这件事情，经过网上的调研，目前公司采用的部署模式是per-job模式，最终选用了基于prometheus，把job指标推送到中间网关的pushgateway上面，然后prometheus去抓取pushgateway上面的信息，从而实现对flink做性能监控，最后通过Grafana进行展示。问题在接入过
PushGateway+Prometheus+Grafana构建Flink实时监控站在最高处呐喊的男人! flink flink 大数据 pushgateway prometheus grafana
#组件简介flinkAPP和linuxsystem两部分，是我们要收集指标数据的组件Pushgateway：是一个推送收集和推送数据的组件Node_exporter：数据导出组件Prometheus：系统监控和预警框架Grafana：可视化展示平台#环境搭建注意，如果浏览器访问不到，iptables-IINPUT-ptcp--dport9090-jACCEPT1.0.flink下载安装包https
行业级开源无人机目标追踪，高空助力抓贼！阿木实验室无人机目标跟踪
活久见！成都一高楼惊险无人机抓小偷视频中危险动作，请勿模仿！本次实验中我们使用的是Prometheus600（P600）行业级无人机研发平台（此平台适用于无人机行业应用开发与室外环境下的无人机算法验证），搭配三轴吊舱，采用了SiamRPN框选跟踪算法，通过目标框的高度估算相机到目标的直线距离，再根据目标中心到画面中心的像素误差计算，获得目标载相机坐标系下的位置。控制节点接收到消息后，结合相机质心到
prometheus + grafana 搭建
docker-compose.ymlversion:'3.8'services:prometheus:image:prom/prometheus:latestcontainer_name:prometheusports:-"9090:9090"volumes:-./prometheus/prometheus.yml:/etc/prometheus/prometheus.ymlgrafana:ima
Grafana 可视化配置 7 号 grafana
Grafana是什么Grafana是一个开源的可视化和监控工具，广泛用于查看和分析来自各种数据源的时间序列数据。它提供了一个灵活的仪表盘（dashboard）界面，用户可以通过它将数据源中的指标进行图表化展示和监控，帮助分析趋势、监控系统健康状态以及进行告警管理。Grafana常用于DevOps、IT基础设施监控和性能优化领域，与Prometheus等监控工具搭配使用非常流行。Grafana的特点
Spring boot Grafana优秀的监控模板笔墨登场说说 grafana
JVM(Micrometer)|GrafanaLabs1SLSJVM监控大盘|GrafanaLabsSpringBoot2.1Statistics|GrafanaLabsspringbootgranfana监控接口指定接口响应的在SpringBoot应用中，使用Grafana进行监控通常涉及以下几个步骤：设置Prometheus作为数据源：Prometheus是一个开源的监控与警报工具，可以收集和
【性能测试】Jmeter+Grafana+InfluxDB+Prometheus Windows安装部署教程软件测试-阿涛性能测试 jmeter grafana prometheus 压力测试性能优化测试工具
一、工具作用与整体架构1.1各工具核心作用工具作用描述关键特性Jmeter性能测试工具，模拟多用户并发请求，生成测试数据支持HTTP/HTTPS、数据库等多种协议，可自定义测试场景InfluxDB时序数据库，专门存储时间序列数据（如Jmeter测试结果）高写入性能，支持Flux查询语言，适合存储海量测试指标Prometheus时序数据库，专注于系统监控指标收集（如CPU、内存、网络）支持数据拉取（
prometheus + kafka_exporter监听kafka
一、下载kafka_exporter安装包1、本地下载后上传到linux服务器下载地址：https://github.com/danielqsj/kafka_exporter/releases/2、直接在linux服务器上wget方式下载#进入目标目录cd/data/prometheus#下载wgethttps://github.com/danielqsj/kafka_exporter/relea
修复 KubeSphere WhizardTelemetry 监控数据为空的实战记录 gs80140 k8s专栏 kubesphere
目录✅修复KubeSphereWhizardTelemetry监控数据为空的实战记录问题回顾故障定位：agentMode配置错误✅解决步骤详解1.恢复agentMode:false2.重装扩展并确认PrometheusServer启动3.验证/query接口可访问4.检查控制台监控展示关键洞察总结最终结果参考与扩展建议✅修复KubeSphereWhizardTelemetry监控数据为空的实战记录
边缘计算监控突围：Prometheus在5G MEC环境中的瘦身方案
作者：开源大模型智能运维FreeAiOps引言：5GMEC场景下的监控挑战与机遇随着5G多接入边缘计算（MEC）的普及，监控系统面临前所未有的挑战：资源碎片化：边缘节点通常部署在资源受限的硬件上（如ARM服务器、工业网关），CPU和内存容量仅为传统云服务器的1/5网络波动性：MEC设备常位于基站侧或工厂车间，面临高丢包率（5%-15%）和间歇性断网问题数据爆炸：单台MEC设备可能承载数百个物联网终
达梦数据库监控观测最佳实践
概述达梦企业管理器简称DEM，架构如下：概略来说，每个数据库主机安装代理程序DMAgent，在监控方面，它将指标发送至DEM服务端，用户可访问DEM控制台查看数据主机和实例的监控指标，在DEM进行配置后可通过http://:8080/dem/metrics端点暴露主机和数据库的Prometheus指标，观测云DataKit可从此端点采集指标完成达梦数据库集成。前提条件监控目标可通过DMAgent上
Zabbix企业级分布式监控付出不多 zabbix 分布式
目录一、zabbix监控系统1.1监控的五大核心类型1.2监控的五层逻辑架构（1）基础设施监控（2）系统层监控（3）应用层监控（4）业务监控（5）端用户体验监控二、监控系统的技术原理2.1监控系统的核心模块2.2数据采集协议分类2.3数据采集模式（1）被动模式（2）主动模式2.4分布式代理架构三、主流开源监控系统对比3.1Zabbix3.2Prometheus+Grafana3.3Nagios3.
HBase监控也想洒脱 JanusGraph hbase
Prometheus+Grafana搭建HBase监控参考https://blog.csdn.net/devcloud/article/details/115069449
Prometheus搭建和 Node_Exporter搭建强_子 prometheus
1.Prometheus和Node_Exporter的关系●Prometheus:是一个开源的监控和告警工具，能够从各种数据源（如NodeExporter）拉取指标，并存储这些指标。它提供了一个强大的查询语言（PromQL），可以用来分析和可视化监控数据。●Node_Exporter:是Prometheus的一个官方插件，用于收集主机系统的硬件和操作系统级别的指标（如CPU使用率、内存使用情况、磁
【Redis篇】数据库架构演进中Redis缓存的技术必然性—高并发场景下穿透、击穿、雪崩的体系化解决方案奈斯DB Redis专栏缓存 redis 数据库架构运维
《博主主页》：CSDN主页__奈斯DBIFClub社区主页__奈斯、《擅长领域》：擅长阿里云AnalyticDBforMySQL(分布式数据仓库)、Oracle、MySQL、Linux、prometheus监控；并对SQLserver、NoSQL(Redis)有了解如果觉得文章对你有所帮助，欢迎点赞收藏加关注作为DBA或运维在日常与Redis打交道时，往往更关注部署安装、Key清理、内存回收、备份
【Grafana】Prometheus指标可视化Grafana，手把手教你如何自定义图形景天科技苑 grafana prometheus prometheus可视化 grafana自定义图形手撕grafana 自定义监控图形
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，云原生k8s，Prometheu
Prometheus+node_exporter+grafana监控部署(上）努力爬的小菜鸟 Linux prometheus grafana linux
目录一、部署Prometheus二、部署node_exporter三、把node_exporter加载进Prometheus四、部署grafana一、部署Prometheus1、从官网下载好Prometheus的安装包2、解压tarxfprometheus-2.41.0.linux-amd64.tar.gz3、做个软链方便更新ln-svprometheus-2.41.0.linux-amd64pr
涨薪技术|Prometheus中部署Alertmanager
部署Alertmanager是Prometheus生态系统中的一个重要步骤，用于管理和处理Prometheus生成的告警。Alertmanager和PrometheusServer一样均采用Golang实现，并且没有第三方依赖。一般来说我们可以通过以下几种方式来部署Alertmanager：二进制包、容器以及源码方式安装。1二进制包部署1)获取并安装软件包Alertmanager最新版本的下载地址
Prometheus怎么监控docker容器给我个详细的教程 Xi Zi docker prometheus 容器运维 kubernetes
Prometheus可以通过Docker容器服务检测来监控Docker容器，具体步骤如下：1.安装Prometheus和NodeExporter，并将它们部署到Docker容器中；2.在Prometheus配置文件中添加NodeExporter的配置；3.配置Prometheus和NodeExporter的服务监控；4.访问Prometheus查看监控结果。
Prometheus监控系列 | blackbox_exporter配置实战降世神童高级IT运维技术专栏 prometheus 云原生
Prometheus监控系列|blackbox_exporter配置实战1.blackbox简介2.blackbox_exporter部署2.1.下载安装包2.2.配置启动文件3.blackbox_exporter配置文件详解3.1.HTTP监控3.2.TCP监控3.3.ICMP监控4.监控域名SSL证书的到期时间5.配置Prometheus配置文件6.Grafana监控展示图1.blackbox
Prometheus（六）黑盒监控疯狂的大饼性能 linux 运维 centos
黑盒监控（blackbox_exporter）之前介绍的对exporter的使用可以称为“白盒监控”，既需要把对应的exporter程序安装到被监控的目标主机上，从而实现对主机资源及其状态的数据采集工作。黑盒监控，blackbox_exporter无须安装在被监控的目标环境中，用户只需要将其安装在于promethenus和被监控目标互通的环境中，通过HTTP、HTTPS、DNS、TCP、ICMP等
Prometheus监控-第1天我为你走过-YOYO prometheus
7.1基于Prometheus的全方位监控平台一、打造基于Prometheus的全方位监控平台1.1、前言官网地址：https://prometheus.io/docs/prometheus/latest/getting_started/灵活的时间序列数据库；定制各式各样的监控规则；Prometheus的开发人员和用户社区非常活跃；独立的开源项目，不依赖于任何公司；继Kurberntes之后第二个
Prometheus 监控系统简介 wespten Linux 自动化运维智能运维性能监控系统调优 TS prometheus
一、监控原理简介监控系统在这里特指对数据中心的监控，主要针对数据中心内的硬件和软件进行监控和告警。从监控对象的角度来看，可以将监控分为网络监控、存储监控、服务器监控和应用监控等。从程序设计的角度来看，可以将监控分为基础资源监控、中间件监控、应用程序监控和日志监控。1、基础资源监控从监控对象的角度来看，可以将基础资源监控分为网络监控、存储监控和服务器监控。1）网络监控这里讲解的网络监控主要包括：对数
5.k8s：helm包管理器，prometheus监控，elk，k8s可视化鹏哥哥啊Aaaa 运维 kubernetes 容器云原生
目录一、Helm包管理器1.什么是Helm2.安装Helm（3）Helm常用命令（4）目录结构（5）使用Helm完成redis主从搭建二、Prometheus集群监控1.监控方案2.Prometheus监控k8s三、ELK日志搜集1.elk流程2.配置elk（1）配置es（2）配置logstash（3）配置filebeat，kibana3.kibana使用和日志检索四、k8s可视化管理1.Dash
Spring Boot Docker容器监控 - 容器化环境监控方案全面指南 Clf丶忆笙 spring boot docker 后端
文章目录一、容器监控基础概念与重要性1.1为什么需要容器监控1.2容器监控与传统监控的区别1.3核心监控指标分类二、SpringBoot与Docker监控基础集成2.1SpringBootActuator基础配置2.2基础Docker监控配置2.3监控数据可视化基础三、高级监控方案实现3.1多维度JVM监控3.2自定义业务指标3.3容器资源限制与监控四、全链路监控方案4.1集成Prometheus
【kafka】在Linux系统中部署配置Kafka的详细用法教程分享景天科技苑 linux基础与进阶 shell脚本编写实战 kafka linux 分布式 kafka安装配置 kafka优化
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，PyQt5和Tkinter桌面应用开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，云原生K8S，Prometheus监控，数据分析，Django
Spring Boot应用监控与管理：Actuator+Prometheus+Grafana终极指南（2025） allenXer Spring Boot 信息可视化 spring boot java
SpringBoot应用监控与管理：Actuator+Prometheus+Grafana终极指南（2025）随着微服务架构的普及，应用监控已成为生产环境的必备能力。本文深入探讨如何通过SpringBootActuator提供深度应用监控，配合Prometheus和Grafana构建完整的企业级监控解决方案。一、监控架构全景图1.1监控技术栈组成1.2核心组件功能对比组件角色关键能力Actuato
全栈运维的“诅咒”与“荣光”：为什么“万金油”工程师是项目成功的隐藏MVP？云原生水神职业发展系统运维运维
大家好，今天，我们来聊一个特殊且至关重要的群体：运维工程师。特别是那些在项目制中，以一己之力扛起一个或多个产品生死的“全能战士”。你是否就是其中一员？你的技能树上点亮了：操作系统、网络协议、mysql与Redis中间件、Docker与K8s容器化、Ansible与Terraform自动化、Go/Python工具开发、Prometheus监控体系、opentelemetry可视化，甚至要负责信息安全
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本

Prometheus 基础入门文档

概述

核心组件详解

Prometheus Server

Exporters

Alertmanager

存储解决方案

安装与配置

安装方法

基本配置

示例配置文件

数据模型与查询语言

数据模型

PromQL 查询语言

示例查询

告警系统

告警规则

示例告警规则

Alertmanager 配置

示例 Alertmanager 配置文件

集成与可视化

与 Grafana 集成

配置步骤

与 Kubernetes 集成

示例 Kubernetes 配置

其他集成

性能优化与高可用

性能优化

高可用架构

联邦集群配置示例

安全配置

示例安全配置

最新版本特性

版本发布周期

新特性与改进

社区与生态系统

结语

你可能感兴趣的:(prometheus)