hashMap的底层数据结构

hashmap的底层原理是许多java程序员面试中几乎次次被提问的问题,对于菜鸟的我两年前被面试也是被问了好多遍,所以有空整理与大家一块学习,hashmap现在大家提起来说的最多的也是红黑树,这几天一直在看红黑树相关的文章,昨天公司同事正好内部分享了以下,就记录下来了。其实jdk1.8才开始有红黑树的,jdk1.8之前则是数组与链表结合起来的。我们这次从hashmap的jdk1.8版本讲起,最后会讲到红黑树的数据结构,以及几种常见的自平衡方法。

1,hashmap的数据结构历史变异

jdk1.6以及jdk1.7的hashmap的数据结构


jdk1.8的hashmap的数据结构

以上图来源于网络,自己再画也是这样的,我们拿来用即可。

我们对比了一下主要是右边部分的变化形成了红黑树,先将这一部分屏蔽,我们看看红黑树之前的构成部分

左边:数组

右边:链表

为什么要用数组链表组合?这里面分别存储的什么呢?

链表是链式的存储结构;数组是顺序的存储结构。

链表通过指针来连接元素与元素,数组则是把所有元素按次序依次存储。

链表的插入删除元素相对数组较为简单,不需要移动元素,且较为容易实现长度扩充,但是寻找某个元素较为困难;

数组寻找某个元素较为简单,但插入与删除比较复杂,由于最大长度需要再编程一开始时指定,故当达到最大长度时,扩充长度不如链表方便

数组查找方便,链表则是进行增删改比较简单只需要改变指针的指向,hashmap再进行数据的操作的时候是先用过对应hash%key.length取余获取对应的数组中的位置,如果数组中中存储的hashcode 和key值以及value对应的是这个数值则进行操作,否则hashcode 对应上了需要去链表中寻找对应的key值。所以对于数组来说查找位置的次数比较多,而链表这个增删改查比较多,因为链表在进行mapkey查找的时候最坏情况可能会到n所以后来出现红黑树进行了优化,我们一会再看红黑树的爱恨情仇。

有没有默认大小,会不会扩容?

hashmap如果不给容量大小则默认是16,阈值为12,当超过最大阈值的时候则进行扩容,每次扩容一倍数,这个容量就是数组的长度,当然由于map数组存放的位置取决于hash%key.length的值那么每次扩容肯定会对当前机构进行调整。hash值是怎么算的,也许看到这好多小伙伴疑惑,我们这里也只能给出浅显的答案来帮助理解,前面看过基础篇的应该有一个印象,根据类型的不同分为不同的hash算法,object 是根据内存地址的一种算法,String 类是根据字符串值按照一种特殊的算法计算出来等等。

我们来看下源码

hashMAP 源码中的初始值
hashmap的四个构造函数默认为无参数的

这里就不和大家一块看源码了,还需要自己私下下功夫,大家可以想象在你往一个map里存放一定的数据条数,无论这样改变放入的顺序查询出来的顺序都是一样的。这个和存放的顺序是有关系的。

2,红黑树的爱恨情仇

红黑树前面我们讲过当链表的长度超过阈值8的时候就会自动换换位红黑树,因为链表的长度如果过长则会降低查询效率,由于二叉树的复杂度,红黑树并不是一个完全的平衡二叉树而是一个近视平衡的带有黑红两种颜色节点的二叉树。

红黑树需要满足以下几点

性质1:每个节点要么是黑色,要么是红色。

性质2:根节点是黑色。

性质3:每个叶子节点(NIL)是黑色。

性质4:每个红色结点的两个子结点一定都是黑色。

性质5:任意一结点到每个叶子结点的路径都包含数量相同的黑结点。

性质4中这个是定死的每个插入的节点必须是红色的,带有两个为NIL的黑色叶子节点,性质6中这个你就从根节点去查到当前叶子节点途径几个黑色节点,如果不满足包含数到每个黑色节点都一样就会进行自平衡,我们也称为黑高相等。

我们将单独有一章节专门讲红黑树的插入以及自平衡

你可能感兴趣的:(hashMap的底层数据结构)