码不停蹄的玄黓

Redis哨兵保姆级详解：从原理到实战，手把手教你搭建高可用架构！

引言：主节点挂了怎么办？Redis的“自动救火队”来了！

相信很多小伙伴在使用Redis时都遇到过这种糟心事：主节点突然宕机，整个服务直接瘫痪，运维同学半夜爬起来手动切换从节点，手忙脚乱不说，业务还可能损失几个亿…（别问我怎么知道的）。这时候，Redis的哨兵（Sentinel）就闪亮登场了！它就像Redis的“私人医生+自动救火队”，能24小时监控主节点状态，一旦发现主节点“不行了”，立刻自动提拔一个从节点上位，还能通知客户端新主节点地址，彻底解决主从架构的单点故障问题！

今天，笔者就带着大家从0到1吃透Redis哨兵：它到底是什么？如何工作？怎么配置？踩过哪些坑？看完这篇，你绝对能上手搭建一个高可用的Redis集群！

一、哨兵到底是啥？一句话总结它的定位

Redis哨兵（Sentinel）是官方提供的高可用（HA）解决方案，本质上是一个分布式监控系统。它不负责存储数据，而是专门“盯着”主从节点的状态：

主节点挂了？它来检测并自动切换新主！
客户端找不到主节点？它来动态同步最新地址！
从节点掉线？它来帮你标记并重新分配任务！

打个比方，如果把Redis主从集群比作一家餐厅，主节点是“主厨”，从节点是“帮厨”，那哨兵就是“大堂经理”——时刻盯着主厨状态，主厨罢工了立刻找备胎帮厨顶上，还负责告诉顾客（客户端）现在谁是主厨，保证餐厅正常营业！

二、哨兵的核心功能：4大技能包，守护Redis不死机

1. 监控（Monitoring）：24小时“查岗”

哨兵会定期（默认1秒）向主节点和所有从节点发送PING命令，就像保安巡逻一样，检查它们是否“活着”。如果某个节点超过指定时间（down-after-milliseconds）没回复，哨兵就会标记它为“主观下线”（自己觉得它可能挂了）。

2. 通知（Notification）：故障“报警器”

一旦检测到节点异常（比如主节点主观下线），哨兵会立刻向客户端、运维系统发送报警（邮件、短信、钉钉都支持），让你第一时间知道“出事了”！

3. 自动故障转移（Failover）：自动“换主”

这是哨兵最核心的功能！当主节点被多数哨兵确认客观下线（不是自己瞎判断，是大家一起投票），哨兵集群会选出一个“领导”（Leader Sentinel），由它完成以下操作：

从存活的从节点中选一个“最优”节点（后面讲选主策略）；
把这个从节点提拔为主节点（发SLAVEOF NO ONE命令）；
让其他从节点重新指向新主节点（发SLAVEOF 新主IP 新主端口）；
更新自己的配置，以后就盯着新主节点了！

4. 配置提供者（Configuration Provider）：动态“导航”

客户端连接Redis时，不用硬编码主节点地址，而是直接连哨兵集群。哨兵会告诉客户端当前主节点的IP和端口，就算主节点切换了，客户端也能自动获取最新地址（通过发布订阅机制）。

三、哨兵的工作原理：从“主观下线”到“故障转移”的全流程

要搞懂哨兵如何工作，必须先理解两个关键概念：主观下线（SDOWN）和客观下线（ODOWN）。

3.1 主观下线（SDOWN）：“我觉得你挂了”

哨兵A每隔1秒给主节点发PING，如果超过down-after-milliseconds（比如5秒）没收到有效回复（比如超时、返回-LOADING错误），哨兵A就会认为主节点“主观下线”（SDOWN）。注意，这只是哨兵A自己的判断，可能误判（比如网络延迟）。

3.2 客观下线（ODOWN）：“大家一起说他挂了”

哨兵A发现主节点SDOWN后，会向其他所有哨兵发送“投票请求”：“兄弟，我觉得主节点挂了，你咋看？”如果超过半数哨兵（比如3个哨兵需要至少2个同意）也认为主节点SDOWN，那么主节点就被标记为“客观下线”（ODOWN）。这时候，故障转移才会正式启动！

3.3 故障转移：Leader Sentinel的“上位之路”

一旦主节点被判定为ODOWN，哨兵集群就要选一个Leader来执行故障转移。选Leader的规则类似“总统选举”：

每个哨兵都觉得自己能当Leader，向其他哨兵发“拉票消息”；
每个哨兵只能投一票，且“先到先得”；
最终获得超过半数票数的哨兵当选Leader（3个哨兵需要2票）。

选好Leader后，它就要干三件大事：

（1）选新主：从从节点里“挑三拣四”

Leader会从存活的从节点中选一个最优秀的当新主，优先级从高到低：

优先级（slave-priority）：从节点配置的slave-priority（数值越小越优先，默认100）。比如一个从节点设为slave-priority 50，另一个是100，那优先级50的会被选中。
复制偏移量（Replication Offset）：从节点已复制的最新数据量（越大说明数据越新）。如果多个从节点优先级相同，选偏移量最大的。
运行ID（Run ID）：从节点的唯一ID（越小越优先）。如果前两个条件都一样，选ID最小的。

（2）提拔新主：让“备胎”转正

Leader给选中的从节点发SLAVEOF NO ONE命令，让它停止复制原主节点，升级为主节点。

（3）同步配置：让其他从节点“认新主”

Leader给其他存活的从节点发SLAVEOF 新主IP 新主端口命令，让它们重新指向新主节点，并开始复制数据。同时，Leader还会更新自己和所有哨兵的配置文件（记录新主节点信息），确保下次监控的是新主。

四、手把手教你搭建哨兵集群：实战步骤+避坑指南

4.1 环境准备

假设我们有3台机器（或3个Docker容器），IP分别是：

主节点：192.168.1.100:6379
从节点1：192.168.1.101:6379
从节点2：192.168.1.102:6379
哨兵1：192.168.1.103:26379
哨兵2：192.168.1.104:26379
哨兵3：192.168.1.105:26379

（注意：哨兵必须部署在不同的机器上，避免单点故障！）

4.2 配置主从复制（先搭基础）

首先确保主从节点已经配置好复制关系。在从节点的redis.conf中添加：

replicaof 192.168.1.100 6379  # 从节点1指向主节点
# 从节点2同理，修改IP即可（如果是多个从节点）

4.3 配置哨兵：sentinel.conf怎么写？

在每个哨兵节点创建sentinel.conf文件，内容如下（以哨兵1为例）：

# 监控主节点：名称、主节点IP、主节点端口、判定客观下线需要的哨兵数（quorum）
sentinel monitor mymaster 192.168.1.100 6379 2

# 主节点主观下线的超时时间（毫秒）：5秒收不到回复就标SDOWN
sentinel down-after-milliseconds mymaster 5000

# 故障转移超时时间（毫秒）：超过这个时间没完成转移就报错
sentinel failover-timeout mymaster 180000

# 从节点并行同步新主的最大数量（减少同步对性能的影响）
sentinel parallel-syncs mymaster 1

# 可选：主节点认证密码（如果主节点启用了requirepass）
sentinel auth-pass mymaster "your_redis_password"

关键参数解释：

quorum：判定主节点ODOWN需要的哨兵数量，必须小于哨兵总数（比如3个哨兵设为2，5个设为3）。
parallel-syncs：故障转移后，允许同时向新主同步数据的从节点数量。设为1可以避免多个从节点同时拉取数据，减少主节点压力。

4.4 启动哨兵集群

在每个哨兵节点执行启动命令：

redis-sentinel /path/to/sentinel.conf

启动后，用以下命令验证哨兵状态：

# 查看所有被监控的主节点
redis-cli -h 192.168.1.103 -p 26379 sentinel masters

# 查看主节点mymaster的详细信息（包括从节点列表）
redis-cli -h 192.168.1.103 -p 26379 sentinel master mymaster

# 查看主节点的从节点
redis-cli -h 192.168.1.103 -p 26379 sentinel slaves mymaster

如果看到主节点状态为ok，从节点列表正常，说明哨兵启动成功！

五、常见问题与避坑指南：这些坑我替你踩过了！

5.1 哨兵集群至少3个实例！

很多人为了省事只部署2个哨兵，这是大忌！因为选举Leader需要超过半数支持，2个哨兵时需要2票（自己+另一个），但如果有1个哨兵挂了，剩下的1个无法达成多数，集群就瘫痪了。记住：哨兵数量必须是奇数（3/5/7）。

5.2 网络分区要小心“脑裂”

如果哨兵和主节点之间发生网络分区（比如主节点在一个机房，哨兵在另一个），可能导致部分哨兵认为主节点SDOWN，另一部分认为主节点存活。这时候可能触发多次故障转移，甚至出现“双主”问题。
解决方法：

确保哨兵和主从节点在同一个局域网，减少网络延迟；
调整down-after-milliseconds参数（比如设为10秒），避免误判；
使用sentinel down-after-milliseconds的合理值，平衡敏感性和误判率。

5.3 客户端必须支持哨兵模式！

如果客户端还是直连主节点IP，哨兵就白搭了！一定要用支持哨兵的客户端（如Jedis、Lettuce）。以Java的Jedis为例，配置如下：

Set<String> sentinels = new HashSet<>();
sentinels.add("192.168.1.103:26379");
sentinels.add("192.168.1.104:26379");
sentinels.add("192.168.1.105:26379");

JedisSentinelPool pool = new JedisSentinelPool("mymaster", sentinels);
Jedis jedis = pool.getResource(); // 自动获取当前主节点地址

5.4 故障转移时的短暂中断

故障转移过程中，主节点切换和从节点同步数据可能需要几秒钟（具体时间取决于数据量和网络），这段时间客户端可能会报“连接拒绝”错误。
优化方法：

减少failover-timeout（默认180秒，可设为30秒）；
确保从节点的数据尽量同步（通过repl-diskless-sync开启无盘复制，减少同步时间）。

六、总结：哨兵是Redis高可用的“基石”

Redis哨兵通过分布式监控和自动故障转移，完美解决了主从架构的单点故障问题。它就像一个不知疲倦的“运维机器人”，24小时盯着主节点，一旦出问题立刻“换主”，还能让客户端无缝切换地址。

不过，哨兵也不是万能的：它适合小规模集群（单主多从），如果数据量极大（比如100G+），或者需要更细粒度的控制，建议考虑Redis Cluster（分片+高可用）。但对于大多数业务场景，哨兵已经足够稳定可靠！

最后，记住一句话：生产环境部署哨兵，一定要用奇数个实例（3/5个），并部署在不同机器上！ 这样才能最大程度避免单点故障，让Redis服务稳如泰山~

如果本文对你有帮助，欢迎点赞收藏，评论区留言讨论你的实战经验！

你可能感兴趣的:(redis,高可用架构,哨兵)

什么是缓存雪崩？缓存击穿？缓存穿透？分别如何解决？什么是缓存预热？ daixin8848 缓存 redis java 开发语言
缓存雪崩：在一个时间段内，有大量的key过期，或者Redis服务宕机，导致大量的请求到达数据库,带来巨大压力-给key设置不同的TTL、利用Redis集群提高服务的高可用性、添加多级缓存、添加降级流策略缓存击穿：给某一个key设置了过期时间，当key过期的时间，恰好这个时间点有大量的并发请求访问这个key，可能会瞬间把数据库压垮-互斥锁：缓存失败时，只允许一个请求去加载数据并更新缓存，其他请求阻塞
基于redis的Zset实现作者的轻量级排名周童學 Java redis 数据库缓存
基于redis的Zset实现轻量级作者排名系统在今天的技术架构中，Redis是一种广泛使用的内存数据存储系统，尤其在需要高效检索和排序的场景中表现优异。在本篇博客中，我们将深入探讨如何使用Redis的有序集合（ZSet）构建一个高效的笔记排行榜系统，并提供相关代码示例和详细的解析。1.功能背景与需求假设我们有一个笔记分享平台，用户可以发布各种笔记，系统需要根据用户发布的笔记数量来生成一个实时更新的
Redis + Caffeine 实现高效的两级缓存架构周童學 Java 缓存 redis 架构
Redis+Caffeine实现高效的两级缓存架构引言在现代高并发系统中，缓存是提升系统性能的关键组件之一。传统的单一缓存方案往往难以同时满足高性能和高可用性的需求。本文将介绍如何结合Redis和Caffeine构建一个高效的两级缓存系统，并通过三个版本的演进展示如何逐步优化代码结构。项目源代码：github地址、gitee地址两级缓存架构概述两级缓存通常由本地缓存（如Caffeine）和分布式缓
Redis 分布式锁深度解析：过期时间与自动续期机制爱恨交织围巾分布式事务 redis 分布式数据库微服务学习 go
Redis分布式锁深度解析：过期时间与自动续期机制在分布式系统中，Redis分布式锁的可靠性很大程度上依赖于对锁生命周期的管理。上一篇文章我们探讨了分布式锁的基本原理，今天我们将聚焦于一个关键话题：如何通过合理设置过期时间和实现自动续期机制，来解决分布式锁中的死锁与锁提前释放问题。一、为什么过期时间是分布式锁的生命线？你的笔记中提到"服务挂掉时未删除锁可能导致死锁"，这正是过期时间要解决的核心问题
如何在 Ubuntu 24.04 或 22.04 Linux 上安装和运行 Redis 服务器山岚的运维笔记 Linux 运维及使用 linux 服务器 ubuntu redis 数据库
Redis（RemoteDictionaryServer，远程字典服务器）是一种内存数据结构存储，通常用作NoSQL数据库、缓存和消息代理。它是开源的，因此用户可以免费安装，无需支付任何费用。Redis旨在为需要快速数据访问和低延迟的应用程序提供速度和效率。Redis支持多种数据类型，包括字符串（Strings）、列表（Lists）、集合（Sets）、哈希（Hashes）、有序集合（SortedS
Ubuntu Docker 安装Redis LLLL96 Ubuntu docker docker redis ubuntu
目录介绍1.数据结构丰富2.高性能3.持久化1.拉取Redis镜像2.创建挂载目录(可选)3.配置Redis持久化(可选)4.使用配置文件运行容器5.查看redis日志介绍1.数据结构丰富Redis支持多种数据结构，包括：字符串（String）:可以用来存储任何类型的数据，例如文本、数字或二进制数据。哈希（Hash）:存储字段和值的映射，适合用于表示对象。列表（List）:有序的字符串列表，可以用
Docker ℡余晖^ 黑马点评项目相关问题和笔记 docker eureka 容器
在黑马点评项目中，在谈到Redisson解决redis的主从一致性问题时，弹幕提到了Docker，本文来简单了解一下Docker，我的初步理解运维是维护多个集群的稳定，那它和VM虚拟机的区别又是什么？，如果要更深入地理解与学习（运维工程师），可以到b站搜索专门的课程（SpringCloud）。一、Docker是什么？重新理解“容器化”的本质1.1Docker的定义Docker是一个开源的容器化平台
分布式全局唯一ID生成：雪花算法 vs Redis Increment，怎么选？
雪花算法vsRedisIncrement：分布式全局唯一ID生成方案深度对比在分布式系统开发中，“全局唯一ID”是绕不开的核心问题。无论是分库分表的数据库设计、订单编号的唯一性保证，还是日志追踪的链路标识，都需要一套可靠的ID生成方案。今天我们就来聊聊两种主流方案——雪花算法（Snowflake）和RedisIncrement，并从原理、特性到适用场景，帮你理清如何选择。同时，我们还将对比其他常见
零基础学习性能测试第八章：高并发-redis缓存架构介绍试着性能测试缓存学习 redis 性能测试零基础
目录一、Redis在高并发中的核心价值二、Redis核心架构模式▶1.缓存穿透防御架构▶2.热点数据多级缓存三、Redis集群高可用方案▶1.RedisCluster分片架构▶2.读写分离方案四、Redis性能压测实战▶1.基准测试工具▶2.关键性能指标五、典型瓶颈分析与优化案例1：缓存雪崩案例2：热Key阻塞六、电商秒杀实战架构七、必须掌握的进阶技巧八、学习路径与工具推荐以下是为零基础学习者设计
Redis五大基本数据类型 ruan114514 redis 数据库缓存 java
Redis作为高性能的键值存储系统，其核心价值在于丰富的数据结构。本文将深入剖析Redis的五种基本数据类型，揭示其内部实现原理，并提供实际应用场景和最佳实践。一、字符串（String）：Redis的基石底层实现Redis字符串使用简单动态字符串（SDS）结构：structsdshdr{intlen;//已使用长度intfree;//未使用空间charbuf[];//字节数组};优势特性：O(1)
redis反弹shell时kali无法接收回弹的解决方法显哥无敌 shell redis
无法接受回谈大概率是bash命令写的不对，那个crontab中间的星号个数是有意义的，不是随便加的，下面贴一下crontab的基本用法https://www.cnblogs.com/zhoading/p/11572630.html{minute}{hour}{day-of-month}{month}{day-of-week}{full-path-to-shell-script}如果是要cronta
ubuntu的redis反弹shell总结 chanra 萌新随笔 ubuntu redis linux
ubuntu的redis反弹shell总结ubuntu要执行有三点：1、ubuntu的默认执行命令的为/bin/dash，我们使用bash-i肯定是弹不了的。2、ubuntu计划任务运行有语法要求，redis写入的文件存在缓存数据，导致语法错误无法运行计划任务。3、文件需要是600rw权限，权限不对也不能运行，不过我直接写入貌似就是600rw。参考链接：http://www.vkxss.top/2
Redis反弹Shell 波吉爱睡觉 web安全 #未授权访问漏洞 #SSRF redis 网络安全 web安全
这里我来总结几种Redis反弹Shell的方法一、利用Redis写WebShell前提条件开了web服务器，并且知道路径，还需要有文件读写增删改查的权限条件比较苛刻，但是满足条件上传就会简单一点，我们直接将文件写入www目录下，完了使用工具连接即可。语句：redis:6379>configsetdir/var/www/html/redis:6379>configsetdbfilenameshell
跳表：来自概率的优雅平衡 allenXer 算法与数据结构 redis 数据结构算法 python 学习
跳表：来自概率的优雅平衡从抛硬币到Redis核心，跳表如何用随机性颠覆数据结构设计引言：平衡的艺术在计算机科学的世界里，数据结构的设计者一直在追求一种完美平衡：快速查询的同时保持高效的插入和删除。平衡树（如AVL树、红黑树）曾是这个领域的王者，但它们的复杂性令人望而生畏。直到1989年，计算机科学家WilliamPugh提出了一种革命性的数据结构——跳表（SkipList），它用概率的魔力实现了近
MutationObserver接口性能分析与优化：DOM监控利器背后的性能陷阱与内存危机 coding随想 JavaScript javascript 前端开发语言
一、DOM的“哨兵”：MutationObserver的崛起在Web开发的江湖中，MutationObserver是一个低调却强大的角色。它像一位忠诚的哨兵，时刻监控着DOM树的风吹草动——属性变化、子节点增删、文本内容更新……开发者们用它来实现动态内容监听、表单验证、甚至自动化测试。然而，这位“哨兵”的背后，却隐藏着不容忽视的性能陷阱和内存危机。1.1MutationObserver的诞生背景在
震惊！DOM变化监控神器MutationObserver，前端开发必知的隐藏武器！ coding随想 JavaScript 前端 javascript html5
一、什么是MutationObserver？如果你是一个前端开发者，一定会遇到这样的场景：页面动态加载内容后，某些操作失效了。比如，你写了一个监听按钮点击的代码，但按钮是通过AJAX动态加载的，你的代码根本无法触发。这个时候，你就需要一个“监控哨兵”——MutationObserver，它能实时监听DOM树的变化，帮你捕获那些“暗中作祟”的节点变动。MutationObserver是HTML5引入
零基础学习性能测试第六章：性能难点-Jmeter实现海量用户压测
目录一、海量压测核心挑战与解决思路二、分布式压测集群搭建（百倍性能提升）1.架构设计2.实战步骤三、百万级用户参数化方案1.Redis预生成测试数据2.JMeter分段读取（避免内存溢出）3.CSV分片策略四、高并发优化配置模板1.`jmeter.properties`关键修改2.线程组配置技巧五、结果收集与监控方案1.轻量级结果存储2.实时监控看板六、海量压测实战案例：双11级流量模拟测试目标：
学习Java项目--尚庭公寓--第7天流萤老公学Java Java第一个后端项目学习学习
一、开发准备：Redis、knife4j入门1、Redis客户端使用redisInsight官方开源的图形化客户端。也可以使用命令行模式2、常用数据类型及命令通用命令（各种数据类型都可以使用的命令）：keys*:查看所有键dbsize：查看键个数exists：判断key是否存在del：删除keyttl：查看key剩余过期时间String类型命令：setkeyvalue：getkeyincr：自增操
Redis弱事务机制深度剖析与实战指南 lxb_不卑不亢 redis redis事务内存数据库
引言在数据库系统中，事务是保证数据一致性的重要机制。与传统关系型数据库的ACID事务不同，Redis提供了一种独特的"弱事务"机制。这种设计在保证高性能的同时，提供了基本的事务功能。本文将深入解析Redis弱事务的本质特性、实现原理、使用场景以及Java语言下的最佳实践，帮助开发者正确理解并合理运用这一重要特性。一、Redis事务的本质特性1.1什么是弱事务Redis的事务与关系型数据库的ACID
redis性能测试报告结果无级程序员数据库大数据 redis 性能
redis性能测试1.环境配置：2.测试准备：2.1每服务器一个Redis的结果：2.2每服务器两个Redis的结果：3.结论：由于项目需要，要查询一个数量巨大的键值对，数据量大约6亿。先是在内存中用hashmap，虽然速度很快，但数据量不到1亿就直接死机了，而且无法持久，每次重新加载，也不合理。于是就想到了redis。测试方法：1.环境配置：主机配置：机器用途配置数量Redis服务器XeonE5
排查解决腾讯云服务器存在对外攻击行为，已阻断该服务器对其他服务器端口（TCP：6379）的访问
【腾讯云】服务违规封禁提醒解决方法来自腾讯客服https://cloud.tencent.com/document/product/296/9604，这是我们给您的建议，建议您排查下您的服务器情况您现在登录上您的服务器了嘛您执行下crontab-l给我看下在执行netstat-ano|egrep"tcp|udp"redis端口这里有问题您执行netstat-tupln给我看下<
ignite redis_全面对比，深度解析 Ignite 与 Spark weixin_39997696 ignite redis
经常有人拿Ignite和Spark进行比较，然后搞不清两者的区别和联系。Ignite和Spark，如果笼统归类，都可以归于内存计算平台，然而两者功能上虽然有交集，并且Ignite也会对Spark进行支持，但是不管是从定位上，还是从功能上来说，它们差别巨大，适用领域有显著的区别。本文从各个方面对此进行对比分析，供各位技术选型参考。一、综述Ignite和Spark都为Apache的顶级开源项目，遵循A
零基础学习性能测试第九章：全链路追踪-项目实操试着性能测试学习性能测试零基础
目录一、实战项目架构（电商下单系统）二、环境搭建（30分钟）1.使用DockerCompose一键部署2.启动命令三、项目集成SkyWalking1.SpringBoot项目添加Agent2.关键业务代码埋点四、全链路压测实战1.JMeter压测脚本配置2.执行压测命令五、全链路追踪分析实战1.在SkyWalking中定位瓶颈2.真实瓶颈分析案例六、中间件性能分析1.Redis性能分析2.MySQ
智能云图库项目
1、项目介绍平台基于SpringBoot+Redis+COS+AI绘图+RabbitMQ+WebSocket，支持图片上传、存储、协作编辑与智能分析。平台分为公共图库、私有图库和企业空间，支持多账号权限体系与实时协作。第一阶段，开发公共图库平台。实战SpringBoot图片素材网址的快速开发，重点学习文件存管业务的开发和优化技巧。第二阶段，对项目的C端功能进行扩展。用户可开通私有空间，并对空间图片
Python,Go, C ++开发升学宝典APP
为了开发一个高效、可扩展的“升学宝典”APP，结合Python、Go和C++的优势，以下是技术架构设计和实现方案：###一、整体技术架构```mermaidgraphLRA[移动端]-->B[Go网关]B-->C[Python微服务]B-->D[C++微服务]C-->E[MySQL]D-->F[Redis]```###二、技术栈分工1.**Python(Django/FastAPI)**-核心业务
零基础学习性能测试第九章：全链路追踪-系统中间件节点监控试着性能测试学习中间件性能测试零基础
目录一、为什么需要监控中间件节点？二、主流中间件监控方案1.监控体系架构2.监控工具矩阵三、环境搭建实战1.部署Prometheus2.部署Grafana四、中间件监控配置实战1.Nginx监控2.Redis监控3.Kafka监控4.MySQL监控五、全链路追踪中的中间件监控1.SkyWalking与Prometheus集成2.全链路视角的中间件监控六、性能瓶颈定位实战1.瓶颈分析流程图2.典型瓶
Python爬虫【三十二章】爬虫高阶：动态页面处理与Scrapy+Selenium+BeautifulSoup分布式架构深度解析实战
目录引言一、动态页面爬取的技术背景1.1动态页面的核心特征1.2传统爬虫的局限性二、技术选型与架构设计2.1核心组件分析2.2架构设计思路1.分层处理2.数据流三、代码实现与关键技术3.1Selenium与Scrapy的中间件集成3.2BeautifulSoup与ScrapyItem的整合3.3分布式爬取实现3.3.1Scrapy-Redis部署3.3.2多节点启动四、优化与扩展4.1性能优化策略
《亿级流量系统架构设计与实战》Redis高可用架构
主从模式一个Master与若干Slave组成主从关系，当Slave与Master首次建立连接时，Master向Slave进行全量数据复制，复制结束后，再根据Master的最新数据变更进行增量数据复制。主从复制流程：Slave连接到Master,发送PSYNC命令准备复制数据Master收到PSYNC命令，执行BGSAVE命令生成目前全量数据的RDB快照文件，并创建缓冲区记录此后Master执行的数
常见的未授权访问如：Redis,MongoDb,Memcached,Jenkins,Jupyter NoteBook,Elasticsearch,Kibana等二十四个靶场复现终焉暴龙王安全网络 web安全
前言这这篇文章中我会记录24种常见的未授权访问漏洞的靶场复现，如果有错误，欢迎大家指正。在本文中，漏洞复现的靶场完全是靠自己搭建的vulhub-master以及一系列的靶场以及fofa搜索，如果之前没有用过vulhub-master靶场，请先搭建好vulhub-master靶场并且安装docker和docker-compose。另外，其中一些涉及到敏感信息的漏洞复现我就不截图了，大家切记要树立好法
Redis如何解决大Key问题 TravisBytes #Redis 编程问题档案 redis 数据库缓存
目录**如何解决Redis大Key（BigKey）问题？****1.什么是大Key？****2.如何发现大Key？****（1）使用`SCAN`命令遍历所有Key****（2）统计Key的类型和大小****3.如何解决大Key问题？****方案1：大Key拆分（Sharding）****（1）String过大：分片存储****（2）List/Set/Hash过大：拆分Key****方案2：分页存储
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他