LiRuiJie

深入剖析Redis Cluster集群，Redis持久化机制，Redis数据类型及其数据结构

一、Redis Cluster 高可用部署方案

1. 部署拓扑设计（推荐）

为了保证高可用 + 扩展性 + 性能，建议采用：

6 主 6 从结构（12 实例）
每个主节点管理 2,738 个 slot，总计 16,384 个 slot

节点分布：
┌─────────────┬──────────────┐
│ 主节点 M1   │ 从节点 S1（备份 M1）│
│ 主节点 M2   │ 从节点 S2（备份 M2）│
│ 主节点 M3   │ 从节点 S3（备份 M3）│
│ 主节点 M4   │ 从节点 S4（备份 M4）│
│ 主节点 M5   │ 从节点 S5（备份 M5）│
│ 主节点 M6   │ 从节点 S6（备份 M6）│
└─────────────┴──────────────┘

建议部署方式：

环境	部署建议
云环境（K8s）	每台机器部署一个 Pod，资源隔离
物理机或虚拟机	每台部署两个实例（一个主一个从，非互为主从）
容器环境	Docker + 网络固定映射（需注意端口）

2. 端口规划

每个 Redis 实例需要开放：

主端口（默认 6379）
集群总线端口（主端口 + 10000） → 16379

例如：

6379 / 6380 / 6381 ...   → 对应 Redis 实例
16379 / 16380 / 16381 ...→ 用于集群心跳、failover 等通信

3. 目录结构建议

/data/redis/
  └── 6379/
        ├── redis.conf
        ├── dump.rdb
        ├── appendonly.aof
        ├── logs/
        └── run/

每个端口一个独立目录。

4. 关键配置项（redis.conf）

最小配置示例（用于集群节点）：

port 6379
cluster-enabled yes
cluster-config-file nodes.conf
cluster-node-timeout 5000
appendonly yes
appendfilename "appendonly.aof"
dbfilename dump.rdb
dir /data/redis/6379
bind 0.0.0.0
protected-mode no
daemonize yes
logfile "/data/redis/6379/logs/redis.log"

✅ 注意：Redis Cluster 模式下必须开启 AOF 或 RDB，否则迁移和重启数据可能丢失。

5. 启动集群节点

假设你启动了以下 6 个主节点和 6 个从节点：

redis-server /data/redis/6379/redis.conf
redis-server /data/redis/6380/redis.conf
...

6. 构建 Redis Cluster

使用 redis-cli --cluster 一键创建集群：

redis-cli --cluster create \
  192.168.0.1:6379 192.168.0.2:6379 192.168.0.3:6379 \
  192.168.0.4:6379 192.168.0.5:6379 192.168.0.6:6379 \
  192.168.0.1:6380 192.168.0.2:6380 192.168.0.3:6380 \
  192.168.0.4:6380 192.168.0.5:6380 192.168.0.6:6380 \
  --cluster-replicas 1

自动将 6 个主节点分配 slot、剩余作为从节点。

7. 高可用保障机制

1. 节点宕机自动 failover

Redis Cluster 采用内部 Gossip + 选举 协议
若主节点宕机，从节点会在 cluster-node-timeout 后自动接管
选举由剩余主节点投票完成（多数选举）

2. 客户端自动重定向（MOVED / ASK）

客户端支持 Redis Cluster 协议，自动更新路由映射表。

8. 安全与稳定性建议

项目	建议配置
密码认证	`requirepass` + `masterauth`
内存限制	`maxmemory` + `allkeys-lru`
延迟监控	`latency-monitor-threshold 100`
审计日志	配置 `logfile` 和 rotate
Redis Sentinel	Redis Cluster 本身已自动选主，不需要 sentinel

9. 监控指标建议

工具	说明
Prometheus + Redis Exporter	监控内存、连接数、命中率、slot 分布等
Grafana	可视化面板
自研监控	重点监控 `cluster_state`, `connected_slaves`, `instantaneous_ops_per_sec`

10. 调优建议

1. 提前规划 slot 分布

使用 --cluster-slots 指定 slot 范围，避免集中热点。

2. Key 设计防跨 slot

使用 Hash Tag，如：

sign:{123}:20250609
order:{uid123}:create

确保 {} 内的内容一致即可定位到同一 slot，支持多 key 操作（如 Lua 脚本）。

11. 常用命令

命令	说明
`redis-cli -c -h host -p port`	连接 cluster 节点
`cluster nodes`	查看节点状态
`cluster slots`	查看 slot 分布
`cluster info`	查看集群状态
`redis-cli --cluster check`	检查集群一致性
`redis-cli --cluster fix`	自动修复 slot 问题

12. 小结

模块	推荐方案
集群拓扑	6 主 6 从
数据结构	Hash Tag 防跨 slot
部署方式	容器化 / 多端口隔离
容灾机制	自动选主 + AOF
管理工具	`redis-cli --cluster`、Exporter
高并发	分区热点、避免集中访问

二、Redis-Cluster集群中数据的读写流程

在 Redis Cluster 中，写入数据的查找过程是通过一种称为 "分片（sharding）+槽位（hash slot）+节点路由" 的机制完成的。这种机制既保证了分布式扩展能力，又保证了较高的效率。

1. 核心概念

1.1 集群槽位（Hash Slot）

Redis Cluster 将所有数据 key 映射到 0~16383（共 16384 个槽位）。
每个节点负责若干个槽位的写入、查询和删除。
key 是通过 CRC16(key) mod 16384 算出来的。

1.2 节点

Redis Cluster 中的每个节点负责一部分槽位（比如节点 A 负责 0~5000）。
集群中包含主节点（Master）和从节点（Slave），主节点负责写入操作，从节点用于备份与故障切换。

2. 写入流程详细剖析

假设我们写入一个 key：set user:123 "Tom"，以下是详细过程：

步骤 1：客户端计算 key 的槽位

slot = CRC16("user:123") % 16384

比如计算结果是 4567，Redis 客户端会尝试去访问负责 slot 4567 的节点。

⚠️ Redis 允许使用“哈希标签”来固定 key 到同一个 slot，例如：set user:{123}:name Tom 和 set user:{123}:age 20 会被 hash 到同一个槽位。

步骤 2：客户端从路由表中查找负责这个 slot 的节点

客户端（比如 JedisCluster、Lettuce、Redisson）在初始化连接时，会从任一节点获取整张路由表：

> CLUSTER SLOTS

返回内容示例：

1) 1) (integer) 0
   2) (integer) 5460
   3) 1) "192.168.1.101"
      2) (integer) 7000
2) 1) (integer) 5461
   2) (integer) 10922
   3) 1) "192.168.1.102"
      2) (integer) 7001

说明：

0 ~ 5460 的 slot 属于 192.168.1.101:7000
5461 ~ 10922 属于 192.168.1.102:7001
...其余依此类推

客户端将这个信息缓存起来，后续操作中直接路由到正确节点，减少中转。

步骤 3：客户端直接将命令发送到对应的节点

根据 slot 映射，客户端直接将命令 SET user:123 Tom 发送到对应节点（如 192.168.1.101:7000），该节点执行写入并返回结果。

步骤 4：数据写入节点内存 + AOF/RDB 机制（与单机一致）

在目标节点中，Redis 会：

将 key 写入内存（dict）
触发 AOF（Append Only File）或 RDB（快照）机制持久化
主节点还会异步将写入同步给从节点

步骤 5：容灾同步（副本机制）

每个主节点都有对应的从节点。写操作默认只写主节点，再由主节点异步复制到从节点（类似 Master-Slave）。

如：

Master A（slot 0~5460） <-- async replicate -- Slave A'

3. 特殊情况：重定向（MOVED、ASK）

3.1 MOVED 重定向

当客户端访问了错误的节点，节点会返回：

-MOVED 4567 192.168.1.102:7001

客户端收到后更新本地路由表，下次访问就直接访问正确节点。

3.2 ASK 重定向（迁移槽位期间）

在 slot 迁移过程中，为了不丢请求，源节点会返回：

-ASK 4567 192.168.1.103:7003

客户端必须先向目标节点发送：

ASKING
SET user:123 Tom

4. 完整流程图（逻辑视图）

客户端 ——> 计算 CRC16(key) % 16384 ——> 查本地槽位路由表
         │
         ├─ 若命中：直接访问目标 Redis 节点
         │
         ├─ 若失败：收到 -MOVED，刷新路由重试
         │
         └─ 若 slot 迁移中：收到 -ASK，发送 ASKING 命令临时重定向

5. 示例：在 Java 中查看 slot 分配

import redis.clients.jedis.HostAndPort;
import redis.clients.jedis.JedisCluster;
import redis.clients.jedis.ClusterSlotRange;

Set nodes = new HashSet<>();
nodes.add(new HostAndPort("192.168.1.101", 7000));
JedisCluster cluster = new JedisCluster(nodes);

List

步骤	内容
1️⃣	计算 key 的槽位：`CRC16(key) % 16384`
2️⃣	查询本地槽位路由表（`CLUSTER SLOTS`）找到对应节点
3️⃣	发送写入命令到目标节点
4️⃣	数据写入内存 + AOF/RDB
5️⃣	主从同步保证容灾
⚠️	Slot 迁移时用 ASK；访问错误节点会返回 MOVED

类型	场景	响应格式	说明
`MOVED`	slot 被分配到其他节点	`MOVED`	永久性跳转，需要更新本地 slot 映射表
`ASK`	临时迁移 slot 过程	`ASK`	临时跳转，只适用于这一次请求

步骤	客户端行为
请求到错误节点	Redis 返回 `MOVED`
客户端收到异常	解析出 slot 和目标地址
更新 slot → 节点缓存	存入 `slotCache` 映射表
重发请求	访问新的目标节点
下一次请求	直接命中缓存节点，无需重定向

触发方式	描述
自动	配置如 `save 900 1`（900 秒至少 1 次写）
手动	命令：`SAVE`（阻塞），`BGSAVE`（异步）
主从同步	主机执行 RDB 并传给从机

优点	缺点
高压缩比，恢复速度快	恢复时精确到某时间点，不是实时
CPU 负载低（周期执行）	fork 时内存消耗大（COW）
更适合冷备份和主从同步	数据可能丢失几分钟

模式	说明
always	每次写操作都 fsync，最安全但最慢
everysec（默认）	每秒 fsync 一次，最佳平衡
no	不主动 fsync，依赖操作系统调度，性能高但风险大

优点	缺点
数据恢复完整性高（几乎不丢）	文件增长较快，需定期 rewrite
可用于操作审计	写入性能略低于 RDB

场景	RDB	AOF
Redis crash	丢失上次 BGSAVE 后写入的数据	最多丢 1 秒数据（everysec）
宿主机断电	可能没有触发 save	如果写入缓冲未 fsync，则丢失
文件损坏	无法恢复	可通过 `redis-check-aof` 修复

场景	推荐
数据恢复速度要求高	RDB
数据安全性高	AOF
主从同步	RDB（第一次同步）
日志审计	AOF（可追踪所有操作）
推荐配置	同时开启 AOF + RDB

特性	RDB	AOF
触发方式	定期快照 / 手动	实时写操作日志
恢复速度	快（秒级）	慢（命令多）
数据完整性	可能丢失	几乎不丢
文件大小	小（压缩好）	大（命令多）
性能影响	低（周期）	中（频繁写）
重启恢复优先级	低	高

数据类型	描述	内部编码	底层数据结构
String	字符串 / 数值	int / embstr / raw	简单动态字符串（SDS）
List	有序列表	ziplist / quicklist	压缩列表 / 快速链表
Hash	字典表	ziplist / hashtable	压缩列表 / 哈希表
Set	无序唯一集合	intset / hashtable	整数集合 / 哈希表
ZSet	有序集合	ziplist / skiplist	压缩列表 / 跳表 + 哈希表
Bitmap	位图	bit array	字节数组
HyperLogLog	基数估计	sparse/dense	稀疏/密集编码
Geo	地理位置	sorted set	跳表结构
Stream	消息队列	radix tree + listpack	压缩字典树

编码	触发条件	描述
int	值可转为 long 且小于 44 字节	使用 long 存储
embstr	小于等于 44 字节	分配连续内存块，更高效
raw	大于 44 字节	普通 SDS 分配堆内存

编码	条件	描述
ziplist	元素较少，元素较小	连续内存，节省空间
quicklist（默认）	统一使用	多个 ziplist 的链表，兼顾空间与性能

编码	条件	描述
ziplist	key/value 都很短，数量少	节省内存
hashtable	元素较多	哈希表，高性能查询

编码	条件	描述
intset	所有元素为整数	整数数组，无 hash 冲突
hashtable	含字符串或数量大	常规哈希表

类型	有序？	可重复？	底层结构	适用场景
String	✘	✔	SDS	缓存、计数器、配置项
List	✔	✔	quicklist	队列、堆栈
Hash	✘	key 唯一	ziplist / dict	对象字段存储
Set	✘	✘	intset / dict	标签、唯一集合
ZSet	✔（按 score）	✘	skiplist + dict	排行榜
Bitmap	✔	✘	字节数组	活跃标志、签到
HLL	✘	✘	计数器	去重统计
Stream	✔	✔	radix tree	消息队列

业务场景	推荐数据类型	说明
缓存页面内容 / JSON	`String`	适用于大段文本、序列化数据
计数器 / 限流器	`String`	支持原子自增 INCR/DECR
用户属性信息（如 name、age）	`Hash`	每个字段作为一个小 key
任务队列 / 消息队列	`List` / `Stream`	支持先进先出 / 多消费者
用户标签、兴趣点	`Set`	无序且唯一
排行榜、积分榜	`Sorted Set`	分数决定排名
每日签到 / 活跃用户标记	`Bitmap`	每 bit 表示一个用户
活跃 IP 数 / 去重统计	`HyperLogLog`	近似去重，占用小
附近的人 / 门店搜索	`Geo`	基于 ZSet 做地理计算

类型	小数据	建议	说明
Hash	< 512 个 field	使用 `HSET`	紧凑、节省空间
List	< 512 元素	使用 `LPUSH` / `RPUSH`	快速队列
Set	元素为整数	使用 `Set` 自动编码为 intset

功能	推荐类型	示例
查询是否存在	`Set` / `Bitmap`	`SISMEMBER` / `GETBIT`
统计总数	`Set` / `HyperLogLog`	精确 vs 近似去重
区间统计	`Sorted Set`	`ZRANGEBYSCORE`
多用户数据隔离	前缀 + 数据类型	`user:1001:tags` (Set), `user:1001:info` (Hash)

编码	条件	描述
ziplist	元素少，数据短	节省空间
skiplist	元素多	支持范围查询、排名查询

类型	小数据结构	大数据结构
String	int / embstr	raw
Hash	ziplist	hashtable
List	ziplist	quicklist
Set	intset	hashtable
ZSet	ziplist	skiplist

场景	推荐类型	说明
用户属性信息	Hash	key → field/value
活跃用户标记	Bitmap	节省空间
每日签到	Bitmap / ZSet	位图 or 排序签到
排行榜	ZSet	分值决定排名
消息队列	List / Stream	简单/强需求分别适配
用户标签	Set	无序唯一集合

设计原则	建议
业务模型和 Redis 数据结构强关联	不要用 `String` 承载复杂对象
利用 key 结构分层管理（如 user:1001:xxx）	避免 key 冲突
大数据分片或拆 key（如 per user / per day）	避免过大 value 或 key 集合
使用 TTL 控制生命周期	清理过期数据，防止内存泄漏
合理估算结构大小选择类型	超过几百万用户用 `Bitmap` / `HyperLogLog` 更合适

场景	类型推荐	注意事项
复杂对象	`Hash`	field 层级比存 JSON 更高效
排行榜	`ZSet`	score 控制排序
热点标记	`Bitmap`	空间效率极高
多端消费	`Stream`	支持消费组 / ack

目标	技术挑战
支持上亿用户	内存占用低，结构压缩高效
支持每日签到	支持按天记录签到状态
支持连续签到计算	需要快速判断连续天数
支持查询某天是否签到	要求 O(1) 查询
高并发	写入/查询高吞吐，热点控制
可扩展	支持多节点，方便水平扩展

功能	实现方式
签到排行榜	用 ZSet 记录连续签到天数
连续签到奖励	连续值计算后发奖
多端防重	使用 SETBIT 幂等性保障
补签功能	允许用户花币/广告后补位

目标	实现方案
存储节省	使用 BitMap，每用户 46B 一年签到数据
查询高效	GETBIT/SETBIT O(1) 操作
连续天数计算	Lua 脚本或 BITFIELD 快速统计
高并发	分桶 + Redis Cluster 分布式架构
扩展性	支持排行榜、补签、领奖逻辑

深入剖析Redis Cluster集群，Redis持久化机制，Redis数据类型及其数据结构

一、Redis Cluster 高可用部署方案

1. 部署拓扑设计（推荐）

建议部署方式：

2. 端口规划

3. 目录结构建议

4. 关键配置项（redis.conf）

5. 启动集群节点

6. 构建 Redis Cluster

7. 高可用保障机制

1. 节点宕机自动 failover

2. 客户端自动重定向（MOVED / ASK）

8. 安全与稳定性建议

9. 监控指标建议

10. 调优建议

1. 提前规划 slot 分布

2. Key 设计防跨 slot

11. 常用命令

12. 小结

二、Redis-Cluster集群中数据的读写流程

1. 核心概念

1.1 集群槽位（Hash Slot）

1.2 节点

2. 写入流程详细剖析

步骤 1：客户端计算 key 的槽位

步骤 2：客户端从路由表中查找负责这个 slot 的节点

步骤 3：客户端直接将命令发送到对应的节点

步骤 4：数据写入节点内存 + AOF/RDB 机制（与单机一致）

步骤 5：容灾同步（副本机制）

3. 特殊情况：重定向（MOVED、ASK）

3.1 MOVED 重定向

3.2 ASK 重定向（迁移槽位期间）

4. 完整流程图（逻辑视图）

5. 示例：在 Java 中查看 slot 分配

6. 小结

三、深入剖析客户端重定向请求流程（Jedis为例）

1. 重定向响应类型

2. 客户端重定向处理流程

3. JedisCluster 重定向缓存机制（源码级剖析）

重定向更新流程：

4. 举例说明：缓存更新演示

5. 与 ASK 的区别

6. 缓存失效机制

7. 小结

四、深入剖析 Redis 的两种持久化机制：RDB与 AOF

1. RDB（Redis DataBase Snapshot）

✅ 1. 原理概览

✅ 2. 触发方式

✅ 3. BGSAVE 背后流程（关键）

✅ 4. 优缺点

2. AOF（Append Only File）

✅ 1. 原理概览

✅ 2. 持久化策略

✅ 3. AOF 重写机制（rewrite）

✅ 4. 优缺点

3. AOF 与 RDB 联合持久化（Redis 推荐）

4. 文件格式解析（底层结构）

✅ 1. RDB 文件格式

✅ 2. AOF 文件格式

5. 持久化过程分析：写入路径对比

RDB

AOF

6. 数据安全性对比（典型故障场景）

7. 实际应用建议

8. 调优建议

✅ RDB 调优

✅ AOF 调优

9. 总结对比表

五、深入剖析Redis都有哪些数据类型及其数据结构

Redis 支持的数据类型总览

1. String —— 基本类型，却极其强大

编码方式

底层结构：SDS（Simple Dynamic String）

⏱ 操作复杂度

2. List —— 双端队列，适合消息队列、任务堆栈等

编码方式

quicklist 结构（Redis 3.2 引入）

⏱ 操作复杂度

3. Hash —— 轻量级对象存储（如用户信息）

编码方式

5. 与 `ASK` 的区别

1. 数据结构选择：`BitMap` 存储每日签到