Java集合之LinkedHashSet源码分析

1.简介

  我们知道Set不允许包含相同的元素,如果试图把两个相同元素加入同一个集合中,add方法返回false。根据源码实现中的注释我们可以知道LinkedHashSet是具有可预知迭代顺序的Set接口的哈希表和链接列表实现。此实现与HashSet的不同之处在于,后者维护着一个运行于所有条目的双重链接列表。此链接列表定义了迭代顺序,该迭代顺序可为插入顺序或是访问顺序。使用示例如下:

  

package com.test.collections;



import java.util.Iterator;

import java.util.LinkedHashSet;



public class LinkedHashSetTest {



	/**

	 * @param args

	 */

	public static void main(String[] args) {

		// TODO Auto-generated method stub

		LinkedHashSet<Integer> set = new LinkedHashSet<Integer>();

		set.add(2);

		set.add(4);

		set.add(1);

		

		Iterator<Integer> iter = set.iterator();

		

		System.out.println(set.isEmpty());

		System.out.println(set.size());

		System.out.println(set.contains(2));

		System.out.println(set.containsAll(c));

		System.out.println(set.remove(2));

		set.clear();



	}



}

2.继承结构

  通过源代码可以看到LinkedHashSet继承了HashSet类,实现了Set、Cloneable以及Serializable接口,通过实现了Set接口我们知道不允许包含相同的元素。可是这个功能限制是如何实现的,我们来看下源代码就可以一目了然了。

3.源码解析

  a:LinkedHashSet类中除了一个序列化ID没有其他的属性了,除了几个构造函数外没有其他的方法,其他的方法都是从HashSet直接继承而来,那就让我们从构造函数入手进行简单的分析。

    public LinkedHashSet(int initialCapacity, float loadFactor) {

        super(initialCapacity, loadFactor, true);

    }





    public LinkedHashSet(int initialCapacity) {

        super(initialCapacity, .75f, true);

    }



    public LinkedHashSet() {

        super(16, .75f, true);

    }





    public LinkedHashSet(Collection<? extends E> c) {

        super(Math.max(2*c.size(), 11), .75f, true);

        addAll(c);

    }

  从代码中给出的四个构造函数我们可以看出功能各异。我们先来看看简单的构造函数,第一个构造函数制定了两个参数,第二个制定了一个参数,第三个是没有参数设定一个空的构造函数,第四个针对集合的初始化的构造函数。如果我们想要清楚构造函数到底做了什么事情,那么我们需要弄清楚super()方法做了什么事情,以及addAll做了什么事情。看源码:

  HashSet(int initialCapacity, float loadFactor, boolean dummy) {

	map = new LinkedHashMap<E,Object>(initialCapacity, loadFactor);

    }

   public boolean addAll(Collection<? extends E> c) {

	boolean modified = false;

	Iterator<? extends E> e = c.iterator();

	while (e.hasNext()) {

	    if (add(e.next()))

		modified = true;

	}

	return modified;

    }

  原来这两个方法就是我们构造函数出现的。通过第一个方法HashSet,中有一个Map,那这又是什么呢。原来HashSet中有一个熟悉private transient HashMap<E,Object> map;这下我们明白了原来Set的底层是采用一个Map实现的。这个很重要的东西,通过Map的相关方法调用来模仿Set的功能。Super方法做的事情就是创建了一个指定大小和加载因子的Map,addAll()方法就是遍历这个集合然后依次将他们放入我们的Map中去,从而实现了用一个集合直接构造含有值的Set。

  回过头来我们看看上面的四个构造方法。第一个方法就是制定了初始容量和加载因子的Set,第二个构造函数就是制定了初始容量的Set,使用系统默认的加载因子0.75。第三个构造函数就是直接调用了一个空的构造函数,默认初始化一个容量为16,加载因子为0.75的Set,最后一个就是使用一个集合初始化Set.

b:iterator()

public Iterator<E> iterator() {

	return map.keySet().iterator();

    }

  iterator(),调用它就可以返回Set的迭代对象,底层是采用Map的keySet()方法实现的。

c:size()

 public int size() {

	return map.size();

    }

  直接返回了Map的容量就得到了Set的元素个数。

d:isEmpty()

 public boolean isEmpty() {

	return map.isEmpty();

    }

  也是调用map的集合是否为空方法。

e:contains()

   public boolean contains(Object o) {

	return map.containsKey(o);

    }

  判断是否含有某一个元素。

f:add()

 public boolean add(E e) {

	return map.put(e, PRESENT)==null;

    }

 

g:remove()和clear()

 public boolean remove(Object o) {

	return map.remove(o)==PRESENT;

    }





    public void clear() {

	map.clear();

    }

  删除元素的时候就是调用map的方法,clear也是一样。

4.其他(小结)

  LinkedHashSet集合是根据元素的hashCode值来决定元素的存储位置,但是它同时使用链表维护元素的次序。这样使得元素看起 来像是以插入顺序保存的,也就是说,当遍历该集合时候,LinkedHashSet将会以元素的添加顺序访问集合的元素。LinkedHashSet在迭代访问Set中的全部元素时,性能比HashSet好,但是插入时性能稍微逊色于HashSet。Set的很多操作都是依赖Map来实现的,下次来学习下Map的源码相关。

你可能感兴趣的:(linkedhashset)