索引的作用毋庸置疑,但他是如何组织,并实现提高语句访问效率的呢?本篇文章为大家做个详细的介绍.
聚集索引架构 B-tree
如图1-1
a.B-tree的结构,叶子节点为数据.数据按照聚集索引键有序排列.
b.每个表只能有一个聚集索引.
c.创建时如果未声明Unique,索引字段有重复值会内部添加唯一标识符(4字节)额外维护
非聚集索引架构 B-tree
如图1-2
a 索引树为B-tree,叶子节点包含索引行内容,并包含指向数据页的书签.当表为堆表时书签为RID(文件号,页号,槽号),用以指向具体数据页进行书签查找.当表为聚集表时书签为聚集索引键,用以指向具体数据页进行键查找.
b 非聚集索引上限个数为999(sql2008)(sql2005为249个)
c 非聚集索引中包含聚集索引键.在包含性列中显示添加不会额外增加存储.
d 如果表为聚集表,则书签为聚集索引,为什么不是RID?
因为聚集表一旦有变动,RID将不再准确,如果根据RID则需额外维护,增加额外成本.
e 查询谓词中有聚集索引时,应显示添加聚集索引未非聚集包含性列
包含性列(include columns)
堆表(heap)
堆表结构.非聚集索引表.数据页由IAM页管理.数据页中每个IAM位图指向一个区.如含有多个IAM页(多数据文件,>4GB),IAM页之间相连
B-tree 索引键值value查找
类似B-tree 索引范围查找(range seek)
a.获取根节点
b.遍历行为查询下边界值找下一层指针
c.继续匹配寻找下一层指针
d.如果没有到达叶子节点,继续b步骤
e.叶子层获取索引行匹配数据(值大于等于下边界值)
f.当到达上边界值时退出.
g.如果页中查找到索引行底部,根据指针获得其他页然后执行e
B-tree 区域扫描(range scan)
注:图示例为升序扫描,降序扫描为先找到last page,再根据指针链找previous page
B-tree 区域扫描预读(readahead)