数据结构-B树

B树( B − B^- B树)

B树是指一个结点中包含多个关键字(如n个关键字),那么它就对应有n+1个孩子结点。具有以下性质:

  • 每个结点x具有以下几个性质
    • x . n x.n x.n: 表明当前结点关键字的个数n
    • x . n x.n x.n个关键字本身按照非降序存放,即: x . k e y 1 x.key_1 x.key1 <= x . k e y 2 x.key_2 x.key2 <= … <= x . k e y n x.key_n x.keyn
    • x . i s L e a f x.isLeaf x.isLeaf, 一个bool值,表明该结点是否是叶子结点。
  • 每个内部结点x还包含 x . n + 1 x.n+1 x.n+1个指向其孩子的指针,叶节点没有
  • 关键字 x . k e y 1 x.key_1 x.key1对存储在各子树中的关键字范围进行分割,如果 k i k_i ki为任意一个存储在以 x . c i x.c_i x.ci为根的子树中的关键字,那么:
    k 1 ≤ x . k e y 1 ≤ k 2 ≤ x . k e y 2 ≤ . . . . . . ≤ x . k e y x . n ≤ k x . n + 1 k_1\le x.key_1\le k_2\le x.key_2\le......\le x.key_{x.n}\le k_{x.n+1} k1x.key1k2x.key2......x.keyx.nkx.n+1
  • 每个叶结点具有相同的深度,即树的高度。
  • 每个结点所包含的关键字个数有上界和下界,用一个被称为B树的最小度数的固定整数 t ≥ 2 t\ge 2 t2来表示这些界:
    • 除了根结点以外的每个结点必须至少有t-1个关键字。因此,除了根结点以外的每个结点至少有t个孩子。如果树非空,根结点至少有一个关键字。
    • 每个结点至多可包含2t-1个关键字。因此,一个内部结点至多可以有2t个孩子。当一个结点恰好有2t-1个关键字时,称该结点是满的。
      数据结构-B树_第1张图片
      B树是为磁盘或其他直接存取的辅助存储设备而设计的一种平衡搜索树。

一个B树的基本数据结构:

struct BTreeNode
{
	bool is_leaf;				// 是否是叶子结点
	int n; 						// 关键字的个数
	std::vector key(n, 0);	// 关键字数组
	std::vector child(n+1, nullptr);  // 孩子结点
}

B + B^+ B+

B树的变种,把所有的卫星数据都存储在叶结点中,内部结点只存放关键字和孩子指针,因此最大化了内部结点的分支因子。 B + B^+ B+树具有以下几个性质:

  • 有k个子树的中间节点包含有k个元素(B树中是k-1个元素),每个元素不保存数据,只用来索引,所有数据都保存在叶子节点。
  • 所有的叶子结点中包含了全部元素的信息,及指向含这些元素记录的指针,且叶子结点本身依关键字的大小自小而大顺序链接。
  • 所有的中间节点元素都同时存在于子节点,在子节点元素中是最大(或最小)元素。

示例如下
数据结构-B树_第2张图片

B + B^+ B+树和B树对比

  1. B+树的层级更少:相较于B树B+每个非叶子节点存储的关键字数更多,树的层级更少所以查询数据更快;

  2. B+树查询速度更稳定:B+所有关键字数据地址都存在叶子节点上,所以每次查找的次数都相同所以查询速度要比B树更稳定;

  3. B+树天然具备排序功能:B+树所有的叶子节点数据构成了一个有序链表,在进行范围查询时更方便,数据紧密性很高,缓存的命中率也会比B树高。

  4. B+树全节点遍历更快:B+树遍历整棵树只需要遍历所有的叶子节点即可,,而不需要像B树一样需要对每一层进行遍历,这有利于数据库做全表扫描。

B树相对于B+树的优点是,如果经常访问的数据离根节点很近,而B树的非叶子节点本身存有关键字其数据的地址,所以这种数据检索的时候会要比B+树快。

数据结构与算法之美——B-树和B+树

你可能感兴趣的:(Data,Structure,Learn,数据结构,B树,B+树)