数据结构与算法面试分享(九):红黑树(R-B Tree)

红黑树(Red Black Tree) 是一种自平衡二叉查找树,是在计算机科学中用到的一种数据结构,典型的用途是实现关联数组,是平衡二叉树和AVL树的折中。

目录

1. 概述

1.1 红黑树的引入

1.2 红黑规则

1.3 红黑树的应用

2. 红黑树的左旋右旋

2.1 红黑树的定义

2.2 红黑树的左旋

2.3 红黑树的右旋

2.4 红黑树新增节点

​编辑

2.5 删除节点

​编辑

3.红黑树的重要知识点

4.为什么要有红黑树

5.应用场景


1. 概述

1.1 红黑树的引入

有了二叉搜索树,为什么还需要平衡二叉树?

在学习二叉搜索树、平衡二叉树时,我们不止一次提到,二叉搜索树容易退化成一条链
这时,查找的时间复杂度从O(log_{2}N)也将退化成O ( N )
引入对左右子树高度差有限制的平衡二叉树,保证查找操作的最坏时间复杂度也为O(log_{2}N)

有了平衡二叉树,为什么还需要红黑树?

AVL的左右子树高度差不能超过1,每次进行插入/删除操作时,几乎都需要通过旋转操作保持平衡
在频繁进行插入/删除的场景中,频繁的旋转操作使得AVL的性能大打折扣
红黑树通过牺牲严格的平衡,换取插入/删除时少量的旋转操作,整体性能优于AVL
      红黑树插入时的不平衡,不超过两次旋转就可以解决;删除时的不平衡,不超过三次旋转就能解决
红黑树的红黑规则,保证最坏的情况下,也能在O(log_{2}N)时间内完成查找操作。

1.2 红黑规则

一棵典型的红黑树,如图所示:

数据结构与算法面试分享(九):红黑树(R-B Tree)_第1张图片

从图示,可以发现红黑树的一些规律:

  • 节点不是红色就是黑色,根节点是黑色
  • 红黑树的叶子节点并非传统的叶子节点,红黑树的叶子节点是null节点(空节点)且为黑色
  • 同一路径,不存在连续的红色节点

以上是我们能发现的一些规律,这些规律其实是红黑规则的一部分。

红黑规则

  1. 节点不是黑色,就是红色(非黑即红)
  2. 根节点为黑色
  3. 叶节点为黑色(叶节点是指末梢的空节点 NilNull
  4. 一个节点为红色,则其两个子节点必须是黑色的(根到叶子的所有路径,不可能存在两个连续的红色节点)
  5. 每个节点到叶子节点的所有路径,都包含相同数目的黑色节点(相同的黑色高度)

一些说明

  1. 约束4和5,保证了红黑树的大致平衡:根到叶子的所有路径中,最长路径不会超过最短路径的2倍。
  2. 使得红黑树在最坏的情况下,也能有O(log_{2}N)的查找效率
  • 黑色高度为3时,最短路径:黑色→ \rightarrow→ 黑色 → \rightarrow→ 黑色,最长路径:黑色→ \rightarrow→ 红色 → \rightarrow→ 黑色 → \rightarrow→ 红色 → \rightarrow→ 黑色
  • 最短路径的长度为2(不算Nil的叶子节点),最长路径为4

3.关于叶子节点:Java实现中,null代表空节点,无法看到黑色的空节点,反而能看到传统的红色叶子节点

4.默认新插入的节点为红色:因为父节点为黑色的概率较大,插入新节点为红色,可以避免颜色冲突

1.3 红黑树的应用

  • Java中,TreeMap、TreeSet都使用红黑树作为底层数据结构
  • JDK 1.8开始,HashMap也引入了红黑树:当冲突的链表长度超过8时,自动转为红黑树
  • Linux底层的CFS进程调度算法中,vruntime使用红黑树进行存储。
  • 多路复用技术的Epoll,其核心结构是红黑树 + 双向链表。

2. 红黑树的左旋右旋

2.1 红黑树的定义

上一章节可知,红黑树要比二叉搜索树多一个颜色属性

同时,为了方便确认插入位置,还可以多一个parent属性,用于表示当前节点的父节点

因此,红黑树节点的定义如下:

数据结构与算法面试分享(九):红黑树(R-B Tree)_第2张图片

红黑树中,有一个root属性,用于记录当前红黑树的根节点

当红黑规则不满足时,需要对节点进行变色或旋转操作

2.2 红黑树的左旋

回忆二叉树的左旋:

(1)手工推演(先冲突,再移动):

  • 根节点成为右儿子的左子树;
  • 右儿子原有的左子树成为根节点的右子树

(2)代码实现(先空位,再补齐):

  • 右儿子的左子树成为根节点的右子树
  • 根节点成为右儿子的左子树

红黑树的左旋

红黑树节点中,包含父节点的引用

进行左旋时,不仅需要更新左右子树的引用,还需要更新父节点的引用

左旋需要三大步(被旋转的节点叫做节点P):

(1)空出右儿子的左子树: (对应下图步骤2)

  • 右儿子的左子树取代右儿子,成为节点P的右子树,从而空出右儿子的左子树
  • 若右儿子的左子树不为空,需要更新左子树的父节点为节点P

(2)空出节点P的父节点: (对应下图步骤3)

右儿子去取代节点P,成为其父节点的子树

父节点指向右儿子

  • 若父节点为null,root将指向右儿子,右儿子成为整棵树的根节点;
  • 节点P是父节点的左子树,则右儿子成为父节点的左儿子;
  • 节点P是父节点的右子树,则右儿子成为父节点的右儿子

(3)节点P和右儿子成功会师: (对应下图步骤4)

上述两步,空出了节点P的父节点和右儿子的左子树。这时直接更新,即可将节点P变成右儿子的左子树。

给出一个不是很正确的示意图

数据结构与算法面试分享(九):红黑树(R-B Tree)_第3张图片

具体代码如下:

数据结构与算法面试分享(九):红黑树(R-B Tree)_第4张图片

2.3 红黑树的右旋

回忆二叉树的右旋:

(1)手工推演(先冲突,再移动):

  • 根节点成为左儿子的右子树
  • 左儿子原有的右子树成为根节点的左子树

(2)代码实现(先空位,再补齐):

  • 左儿子的右子树成为根节点的左子树
  • 根节点成为左儿子右子树

红黑树的右旋

与红黑树的左旋一样,由于父节点引用的存在,不仅需要更新左右子树的引用,还需要更新父节点的引用

右旋需要三大步(被旋转节点称为节点P):

(1)空出左儿子的右子树: (对应下图步骤2)

  • 左儿子的右子树取代左儿子,成为节点P的左子树,以空出左儿子的右子树
  • 若左儿子的右子树不为空,需要更新右子树的父节点为节点P

(2)空出节点P的父节点: (对应下图步骤3)

  • 左儿子取代节点P,成为其父节点的子树
  • 父节点指向左儿子:

。父节点为空,root将指向左儿子,左儿子成为整棵树的根节点

。节点P为父节点的左子树,左儿子成为父节点的左子树

。节点P为父节点的右子树,左儿子成为节点P的右子树

(3)节点P和左儿子成功会师: (对应下图步骤4)

上述两步,空出了节点P的父节点和左儿子的右子树。这时直接更新,即可将节点P成左儿子的右子树

给出一个不是很正确的示意图

数据结构与算法面试分享(九):红黑树(R-B Tree)_第5张图片

具体代码如下:

数据结构与算法面试分享(九):红黑树(R-B Tree)_第6张图片

2.4 红黑树新增节点

一些规则:

  • 新插入的节点默认为红色,原因:插入黑色节点会影响黑色高度,对红黑树的影响更大;
  • 新增节点x时,循环的依据: x != null && x != root && x.parent.color == RED,即节点非空、不是整棵树的根节点(保证存在父节点)且父节点为红色(违反红黑规则4,需要调整)
  • 完成循环调整后,需要将整棵树的根节点设为黑色,以满足红黑规则1;同时,根节点设为黑色,不会影响从根节点开始的所有路径的黑色高度

2.4.1 父亲为祖父的左儿子

情况一:父亲和叔叔都是红色

当父亲为祖父的左儿子,父亲和叔叔都是红色时:

(1)将父亲和叔叔改成黑色,以满足红黑规则4

(2)父亲和叔叔变成黑色了,黑色高度变化,需要将祖父变成红色,以满足红黑规则5

(3)从祖父开始,继续调整

示意图如下:

数据结构与算法面试分享(九):红黑树(R-B Tree)_第7张图片

情况二:叔叔为黑色,自己是父亲的左儿子

父亲为祖父的左儿子,叔叔为黑色,自己是父亲的左儿子

(1)父亲变成黑色,祖父变成红色(右子树的黑色高度变低)

(2)对祖父进行右旋,让父节点成为新的祖父,以恢复右子树的黑色高度

(3)不满足循环条件,退出循环

示意图如下:

数据结构与算法面试分享(九):红黑树(R-B Tree)_第8张图片

情况三:叔叔为黑色,自己是父亲的右儿子

父亲为祖父的左儿子,叔叔为黑色,自己是父亲的右儿子

(1)父亲成为新的x,对父亲进行左旋操作,构造情况二的初始状态

(2)按照情况二,对新的x(原父亲)进行处理

示意图如下:

数据结构与算法面试分享(九):红黑树(R-B Tree)_第9张图片

2.4.2 父亲为祖父的右儿子

情况一:父亲和叔叔都是红色

父亲为祖父的右儿子,父亲和叔叔都是红色

(1)将父亲和叔叔都变成黑色,以保证红黑规则4

(2)将祖父变成红色,以保证红色规则5(相同的黑色高度)

(3)从祖父开始,继续调整

示意图如下:

数据结构与算法面试分享(九):红黑树(R-B Tree)_第10张图片

情况二:叔叔为黑色,自己是父亲的右儿子

父亲为祖父的右儿子,叔叔为黑色,自己是父亲的右儿子

(1)父亲变成黑色,祖父变成红色(左子树的黑色高度降低)

(2)对祖父进行左旋操作,以恢复左子树的黑色高度

(3)不满足循环条件,退出循环

示意图如下

数据结构与算法面试分享(九):红黑树(R-B Tree)_第11张图片

情况三:叔叔为黑色,自己是父亲的左儿子

父亲是祖父的右儿子,叔叔为黑色,自己是父亲的左儿子

(1)父节点成为新的X,对父亲进行右旋操作,构造情况二的初始情况

(2)按照情况二,对新的x(原父节点)进行处理

示意图如下

数据结构与算法面试分享(九):红黑树(R-B Tree)_第12张图片

2.4.3 规律总结

  • 循环条件:x != null && x != root && x.parent.color == RED,即节点非空、不是整棵树的根节点(保证存在父节点)且父节点为红色
  • 最终处理:将整棵树的根节点变成黑色,以满足红黑规则1,又不会违反红黑规则5
  • 对父亲是祖父的左儿子或右儿子的处理是对称的,只需要理解左儿子时的处理方法,就可以举一反三,知道对右儿子的处理方法

父亲为祖父的左儿子:

  1. 父亲和叔叔都是红色,将父亲和叔叔变成黑色,祖父变成红色,继续对祖父进行调整
  2. 叔叔是黑色,自己是父亲的左儿子:父亲变成黑色,祖父变成红色;对祖父进行右旋以满足红黑规则;此时节点不满足循环条件,可以退出循环。
  3. 叔叔是黑色,自己数父亲的右儿子:父亲成为新的X,对父亲执行左旋操作,构造情况2;按照情况2继续进行处理

总结: 父叔同色,只进行变色操作;父叔异色,自己是右儿子,则进行LR操作;父叔异色,自己是左儿子,则进行R操作。

父亲为祖父的右儿子

  • 父叔同色,只进行变色操作
  • 父叔异色,自己是左儿子,则进行RL操作
  • 父叔异色,自己是右儿子,则进行L操作

2.4.4 代码实现

根据上面的分析,不难写出新增红黑节点后的代码。假设新增的节点为p,则代码如下:

数据结构与算法面试分享(九):红黑树(R-B Tree)_第13张图片

数据结构与算法面试分享(九):红黑树(R-B Tree)_第14张图片

2.5 删除节点

一些规则:

  • 删除节点时,通过节点替换实现删除
  • 假设替换节点为x,需要在x替换被删节点后,从x开始进行调整
  • 调整操作,循环的依据: x != root && x.color == BLACK,即替换节点不能为整棵树的根节点,替换节点的颜色为黑色(改变了红黑高度)
  • 完成循环调整后,需要将x设为黑色,结束调整

2.5.1 自己是父亲的左儿子

情况一:兄弟为红色

此时,自己为黑色、兄弟为红色、父节点为黑色(满足红黑规则4)

(1)将兄弟变成黑色,父节点变成红色;这时,以父节点为起点的左子树黑色高度降低

(2)对父节点进行左旋,以恢复左子树黑色高度;同时,兄弟的左孩子成为新的兄弟

此时,自己和兄弟都是黑色,可能满足满足情况2、3和4、4

示意图如下:

数据结构与算法面试分享(九):红黑树(R-B Tree)_第15张图片

情况二:兄弟为黑色,左右侄子也是黑色

此时,自己和兄弟都是黑色,父节点为黑色或红色;兄弟的两个儿子,都是黑色,将兄弟变成为红色,x指向父节点,继续进行调整

示意图如下:

数据结构与算法面试分享(九):红黑树(R-B Tree)_第16张图片

情况三:兄弟为黑色,右侄子为黑色

此时,自己和兄弟均为黑色,父节点为红色或黑色;右侄子为黑色、左侄子为红色;

(1)将左侄子变成黑色,兄弟变为红色;这时,以兄弟为起点的右子树黑色高度降低

(2)将兄弟节点右旋,以恢复右子树的黑色高度;这时,左侄子将成为新的右兄弟

此时,兄弟的右儿子为红色,满足情况4;继续按照情况4,对节点x进行调整

示意图如下:

数据结构与算法面试分享(九):红黑树(R-B Tree)_第17张图片

情况四:兄弟为黑色,右侄子为红色

此时,自己和兄弟都是黑色,父节点为红色或黑色;右侄子为红色,左侄子为黑色或红色

(1)兄弟颜色改成与父节点一致,右侄子和父节点都变成黑色

(2)为了保证父节点变为黑色后,不影响所有路径的黑色高度,需要将父节点左旋(兄弟节点上提)

(3)x指向根节点,结束循环

示意图如下:

数据结构与算法面试分享(九):红黑树(R-B Tree)_第18张图片

2.5.2 自己是父亲的右儿子

情况一:兄弟是红色节点

此时,兄弟是红色节点,父节点必为黑色;若兄弟有左右儿子,左右儿子必为黑色(满足红黑规则4)

(1)将兄弟变成黑色节点,父节点变成红色;这时,以父节点为起点的右子树黑色高度降低

(2)将父节点右旋,以恢复右子树的黑色高度;这时,兄弟的右孩子成为新的兄弟

此时,自己和兄弟都是黑色,将满足情况2、3和4、4

示意图如下:

数据结构与算法面试分享(九):红黑树(R-B Tree)_第19张图片

情况二:兄弟是黑色,左右侄子也是黑色

此时,自己和兄弟是黑色,父节点可以为红色或黑色,将兄弟变成红色,x指向父节点,继续对父节点进行调整

示意图如下:

数据结构与算法面试分享(九):红黑树(R-B Tree)_第20张图片

情况三:兄弟为黑色,左侄子为黑色

此时,自己和兄弟均为黑色,父节点为黑色或红色;左侄子为黑色,右侄子为红色

(1)将右侄子变成黑色,兄弟变成红色;这是,以兄弟为起点的左子树黑色高度降低

(2)将兄弟左旋,以恢复左子树的黑色高度;这时,右侄子成为新的兄弟

此时,将满足情况4,可以按照情况4,继续进行调整

示意图如下:

数据结构与算法面试分享(九):红黑树(R-B Tree)_第21张图片

情况四:兄弟为黑色,左侄子为红色

此时,自己和兄弟均为黑色,父节点为红色或黑色;左侄子为红色,右侄子为红色或黑色

(1)将兄弟变成与父节点一样的颜色,左侄子和父节点变成黑色

(2)为了保证父节点变成黑色,不会影响所有路径的黑色高度,需要将父节点右旋(兄弟上提)

(3)x指向根节点,退出循环

示意图如下:

数据结构与算法面试分享(九):红黑树(R-B Tree)_第22张图片

2.5.3 规律总结

  • 循环条件:x != root && x.color = BLACK,x不是根节点且颜色为黑色
  • 收尾操作:将x置为黑色
  • x为父亲的左儿子或右儿子,处理操作是对称的;同样只需要记住左儿子时的操作,即可举一反三

x为父亲的左儿子

  1. 兄弟为红色:将兄弟变成黑色,父节点变成红色;对父节点左旋,恢复左子树的黑色高度,左侄子成为新的兄弟
  2. 兄弟为黑色,左右侄子为黑色:兄弟变成红色,x指向父节点,继续进行调整
  3. 兄弟为黑色,右侄子为黑色(左侄子为红色):左侄子变成黑色,兄弟变成红色;兄弟右旋,恢复右子树的黑色高度,左侄子成为新的兄弟
  4. 兄弟为黑色,右侄子为红色:兄弟变成父节点颜色,父节点和右侄子变成黑色;父节点左旋,x指向整棵树的根节点,结束循环

2.5.4 代码实现

删除节点后,调整红黑树的代码如下:

数据结构与算法面试分享(九):红黑树(R-B Tree)_第23张图片

数据结构与算法面试分享(九):红黑树(R-B Tree)_第24张图片

数据结构与算法面试分享(九):红黑树(R-B Tree)_第25张图片

3.红黑树的重要知识点

  • 从二叉搜索树 → \rightarrow→ AVL,严格控制左右子树高度差,避免二叉搜索树退化成链表(时间复杂度从O(log_{2}N)退化成O ( N )
  • 从AVL → \rightarrow→ 红黑树,牺牲严格的平衡要求,以换取新增/删除节点时少量的旋转操作,平均性能优于AVL;通过红黑规则,保证在最坏的情况下,也能拥有O(log_{2}N)的时间复杂度新城
  • 红黑树的应用:Java的TreeMap、TreeSet、HashMap(JDK1.8);linux底层的CFS进程调度算法中,vruntime使用红黑树进行存储;多路复用技术的Epoll,其核心结构是红黑树 + 双向链表。
  • 红黑规则
  • 红黑树节点的定义、红黑树的定义、红黑树的左旋、右旋操作
  • 红黑树新增节点后的调整,记住左儿子的情况,举一反三右儿子的情况
  • 红黑树删除节点后的调整,记住左儿子的情况,举一反三右儿子的情况

4.为什么要有红黑树

我们在上一篇博客认识到了平衡二叉树(AVLTree),了解到AVL树的性质,其实平衡二叉树最大的作用就是查找,AVL树的查找、插入和删除在平均和最坏情况下都是O(logn)。AVL树的效率就是高在这个地方。如果在AVL树中插入或删除节点后,使得高度之差大于1。此时,AVL树的平衡状态就被破坏,它就不再是一棵二叉树;为了让它重新维持在一个平衡状态,就需要对其进行旋转处理, 那么创建一颗平衡二叉树的成本其实不小. 这个时候就有人开始思考,并且提出了红黑树的理论,那么红黑树到底比AVL树好在哪里?

红黑树与AVL树的比较:

  • 1.AVL树的时间复杂度虽然优于红黑树,但是对于现在的计算机,cpu太快,可以忽略性能差异
  • 2.红黑树的插入删除比AVL树更便于控制操作
  • 3.红黑树整体性能略优于AVL树(红黑树旋转情况少于AVL树)

红黑树的性质: 红黑树是一棵二叉搜索树,它在每个节点增加了一个存储位记录节点的颜色,可以是RED,也可以是BLACK;通过任意一条从根到叶子简单路径上颜色的约束,红黑树保证最长路径不超过最短路径的二倍,因而近似平衡。

具体性质如下:

  • 每个节点颜色不是黑色,就是红色
  • 根节点是黑色的
  • 如果一个节点是红色,那么它的两个子节点就是黑色的(没有连续的红节点)
  • 对于每个节点,从该节点到其后代叶节点的简单路径上,均包含相同数目的黑色节点

5.应用场景

  • Java ConcurrentHashMap & TreeMap
  • C++ STL: map & set
  • linux进程调度Completely Fair Scheduler,用红黑树管理进程控制块
  • epoll在内核中的实现,用红黑树管理事件块
  • nginx中,用红黑树管理timer等

你可能感兴趣的:(数据结构与算法,数据结构)