TsingHuaDSA-树

该文章为清华大学数据结构与算法设计MOOC课程读书笔记.

1. 数据结构的静态操作与动态操作

静态操作(static operation) : search
动态操作(dynamic operation) : insert, remove

效率	Vector	List
static	O(lgn)	线性
dynamic	线性	O(1)

因为vector和list在静态或者动态操作中，有一种操作为线性的效率，因此称他们为线性数据结构。

Tree综合了Vector和List的优点，高效地兼顾了静态操作与动态操作。虽然具有线性特征，但是不完全是线性结构，因此可以称之为半线性结构。

2. 有根树与有序树

有根：树本身是一个图，指定图中某个点为root，该图则变成有根树。
有序：在数学上树的孩子可以无序，但是在计算机对树的表示中，需要指定出孩子间所存在的一种有序性，因此称为有序树。

有序树

关于树的节点还有边的关系，重要的是：它们的数量级同阶

3. 树结构的特性（与图的区别）

简单来讲，树是一种连通无环图.

连通性(connected)：任意两点之间均有路径 -> 边数不会太少
无环性(acyclic)：不存在环路 -> 边数不能太多

推论：

任何节点v与root之间存在唯一的path

对于半线性的另一种理解：前驱(prev)只有一个，唯一确定，后继(succ)可以有多个，不确定。

4. 树的表示

“长子兄弟(1st-child & sibling)”法：每个节点维持两个指针，一个指针指向第一个child node，另一个指针指向后一个sibling node。

5. 二叉树

5.1 性质

二叉树性质

节点数最少与高度h同阶，最多可以是高度h的幂指数级。

5.2 表示与实现

二叉树实现

6. 二叉树的遍历

通过遍历，将半线性结构的树转换为完全线性结构的遍历序列，使某些问题得到简化。

二叉树的遍历

按照节点被访问的顺序分类：先序(pre-order)，中序(in-order)，后序(post-order)，层次(level-order)

特点：每个节点只被访问一次，复杂度O(n).

6.1 先序遍历

(1)递归实现

按照定义，递归实现很简单。但是在运行栈中，由于每个递归实例需要占据固定的空间，递归实现的效率其实并不高。

(2)迭代实现1

先序遍历迭代实现思路

先序遍历迭代实现

因为stack的LIFO性质，注意节点入栈的顺序：先右后左

(3)迭代实现2

虽然迭代实现1非常简单易懂，但是不利于推广到中序以及后序遍历中，因此需要一个更加能够抓住遍历本质的算法。

观察

左侧链

通过对遍历过程的观察可知，遍历具有这样一个特点：先沿着左侧链(left-branch)不断向下访问，再自下而上地去访问右子树。

因此，实现的思路是：

沿着left-branch自上而下地访问节点，同时将其对应的右孩子压入栈中。

实现-part1

实现-part2

6.2 中序遍历

(1) 递归实现

同理

(2) 迭代实现

观察

左侧链

观察可知：最先访问的节点是最左的节点，总体而言自下而上地进行访问。因此需要一种LIFO的数据结构-Stack。

因此，实现的思路是：

沿着left-branch找到最左节点并访问，在这个过程中将沿途的节点压入栈中。访问完当前节点后控制权转移到当前节点的右子树。

实现

(3) 效率分析 - 分摊分析(Amortized Analysis)法

效率分摊分析

乍一看，两个循环，每个循环最坏可以达到O(n)，因此O(n^{2)。这好比一个正方形，每个循环分别代表一条边，因为每条边的长度O(n)，因此面积O(n}2)。

但是仔细分析之后，真正的运行时间好比正方形框中的一条条直线，每条直线的长度对应s.push()的操作次数，因为每个节点最多入栈一次，节点数目为n，因此各条直线的累积和为O(n)。相当与平均下来，每条直线的长度只是O(1)，因此实际面积(即实际时间复杂度)为O(n).

6.3 后序遍历

难点

观察

左侧链

观察可知：最先访问的节点是最左的叶节点，总体而言自下而上地进行访问。因此需要一种LIFO的数据结构-Stack。

因此，实现的思路是：

沿着left-branch找到最左叶节点并访问，在这个过程中将沿途的节点以及其右子树节点压入栈中。访问完当前节点后控制权转移到当前节点的右子树。

实现-part1

实现-part2

后序遍历应用 - 表达式树

前缀表达式构建表达式树

后序遍历表达式树可生成RPN

对表达式树的后序遍历可以生成RPN，再根据RPN的算法来计算表达式的值。

6.4 层次遍历

思路：在之前的三种遍历中，都有着一种逆序访问的过程，即后代咸鱼祖先被访问。因此，这三种遍历的实现都借助与Stack这种具有LIFO特性的数据结构。但是在层次遍历中，严格遵循着父辈先与子辈被访问，因此需要一种FIFO的数据结构-Queue。

实现

6.5 重构

思想：通过遍历序列确定root + 左子树节点 + 右子树节点，然后递归地重构出二叉树。

(1) 普适方法

二叉树的重构

通过先序/后序遍历的序列来确定root，再根据中序遍历序列来确定左、右子树。

注意，只通过先序和后续遍历的序列，是不能够保证重构的，因为：

若只存在左子树或者右子树，是无法确定是左子树还是右子树的。

(2) 特殊情况：真二叉树proper binary tree

由于在真二叉树中，某个节点要么左右子树都没有，要么左右子树都有，因此可以确定出root，左子树以及右子树。

真二叉树重构

TsingHuaDSA-树

1. 数据结构的静态操作与动态操作

2. 有根树与有序树

3. 树结构的特性（与图的区别）

4. 树的表示

5. 二叉树

5.1 性质

5.2 表示与实现

6. 二叉树的遍历

6.1 先序遍历

(1)递归实现

(2)迭代实现1

(3)迭代实现2

6.2 中序遍历

(1) 递归实现

(2) 迭代实现

(3) 效率分析 - 分摊分析(Amortized Analysis)法

6.3 后序遍历

后序遍历应用 - 表达式树

6.4 层次遍历

6.5 重构

(1) 普适方法

(2) 特殊情况：真二叉树proper binary tree

你可能感兴趣的:(TsingHuaDSA-树)