Redis运维问题解决:哨兵集群QPS飙升排查及解决方案

小亦平台会持续给大家科普一些运维过程中常见的问题解决案例,运维朋友们可以在常见问题及解决方案专栏查看更多案例。

1. 问题概述

某Redis哨兵架构集群在近期每日7:24-7:25期间QPS异常冲高至7万以上,经排查发现同一时间点存在跑批任务,导致主节点负载激增。

2. 问题分析

经过观察监控图发现每天异常冲高的时间点都在早上7:24~7:25之间。通过确认,在7:22有一个跑批任务,由于在这个时间点客户业务是非常少的,也就基本确定是这个跑批任务导致的QPS异常升高。

Redis运维问题解决:哨兵集群QPS飙升排查及解决方案_第1张图片

3. 解决方案与优化建议

优化措施:

1. 方法一:

现在的redis是哨兵架构,一主两从。在实际运行中,从节点是无法分担主节点上的压力的。可以考虑把redis改成集群架构。集群一般采用三主三从架构,这三个主都能同时提供服务,可以分担跑批带来的运行压力。

2. 方法二:

从应用方向优化跑批任务降低命令的执行频率,这样是最有效降低QPS的措施。这个操作只能应用去优化,在redis上是无法对QPS进行限制的。

如需定制化优化方案或遇到突发流量问题,可以提交工单,小亦平台助您高效运维!

解锁小亦平台的更多功能:

小亦平台AI巡检Agent现已正式开放!三步实现智能运维,get专业巡检报告

你可能感兴趣的:(Redis常见问题及解决方案,redis,运维,数据库,小亦平台,redis问题解决,QPS异常,运维问题解决方法)