Oracle索引结构

BTREE索引

索引是建立在是表的具体列上的,其存在的目的是让表的查询变得更快,效率更高。表的记录丢失关乎生死,索引丢失只需要重建即可。

Oracle索引结构_第1张图片

由图可知,索引是由Root(根块)、Branch(茎块)和Leaf(叶子块)三部分组成。

  • Leaf存储了key column value (索引具体值),以及能具体定位到数据块所在位置的rowid

举个例子,select * from t where id = 12 大概会经过多少个IO?

Oracle索引结构_第2张图片

首先定位到节点的根部(第1次),接下来根据根块数据的分布,定位到索引的茎部(第2次);然后定位到叶子块,找到id=12的部分(第3次)。从索引块到数据块获取其他各列信息(第4次)。

物理结构还是逻辑结构

  1. 要建索引先排序

rowid 伪列,这是第一行的唯一标记,第一行的rowid值绝对不重复,它可将行的记录定位到数据库的位置。

Oracle索引结构_第3张图片

如图,建立索引后,先从test表中的id列的值顺序取出数据放在内存中(除了该列值,rowid也会一并被取出)。如下图,

Oracle索引结构_第4张图片
  1. 列值入块成索引

依次将内存中的顺序存放的列的值和对应的rowid存进Oracle空闲的BLOCK中,形成了索引块,如下图所示,

Oracle索引结构_第5张图片
  1. 填满一块接一块

随着索引列值不断插入,index block1(L1)很快就被插满了, 比如接下来取出的 id=9 的记录就只有插入到新的Oracle块中,如果图所示 index block2(L2)。与此同时,新的数据写到另一个块index block3(B1)中。index block3(B1)担负起管理的角色,记录了L1和L2的信息,并不记录具体的索引列的键值。

Oracle索引结构_第6张图片
  1. 同级两块需人管

B1块虽然仅仅存放叶子块的标记,但随着数据的增多,最终也会容纳不下。这些会诞生root根块,管理B1,B2。

Oracle索引结构_第7张图片

索引结构三大特性

  1. 索引高度较低。一张500G的大表,记录有几百亿条数据,但是该表上某列的索引的高度也才不过6层而已。
    • 数据库最小的单位是块,但最小分配单位是区,要存在一个段至少需要一个区。
    • 如果查询返回大部分的数据,索引返回要慢得多。全表扫描还有一个优势,就是一次可以读多个块。索引读一次只能读一个快,因为并发不能保证数据有序。
  2. 索引存储列值。叶子块存储索引的列值和rowid
  3. 索引本身有序。索引是从表中取出数据,再顺序插入到块里形成索引块的。

你可能感兴趣的:(Oracle)