Java集合之LinkedHashSet源码分析

1.简介

　　我们知道Set不允许包含相同的元素，如果试图把两个相同元素加入同一个集合中，add方法返回false。根据源码实现中的注释我们可以知道LinkedHashSet是具有可预知迭代顺序的Set接口的哈希表和链接列表实现。此实现与HashSet的不同之处在于，后者维护着一个运行于所有条目的双重链接列表。此链接列表定义了迭代顺序，该迭代顺序可为插入顺序或是访问顺序。使用示例如下：

package com.test.collections;

import java.util.Iterator;
import java.util.LinkedHashSet;

public class LinkedHashSetTest {

	/**
	 * @param args
	 */
	public static void main(String[] args) {
		// TODO Auto-generated method stub
		LinkedHashSet<Integer> set = new LinkedHashSet<Integer>();
		set.add(2);
		set.add(4);
		set.add(1);
		
		Iterator<Integer> iter = set.iterator();
		
		System.out.println(set.isEmpty());
		System.out.println(set.size());
		System.out.println(set.contains(2));
		System.out.println(set.containsAll(c));
		System.out.println(set.remove(2));
		set.clear();

	}

}

2.继承结构

　　通过源代码可以看到LinkedHashSet继承了HashSet类，实现了Set、Cloneable以及Serializable接口，通过实现了Set接口我们知道不允许包含相同的元素。可是这个功能限制是如何实现的，我们来看下源代码就可以一目了然了。

3.源码解析

　　a:LinkedHashSet类中除了一个序列化ID没有其他的属性了，除了几个构造函数外没有其他的方法，其他的方法都是从HashSet直接继承而来，那就让我们从构造函数入手进行简单的分析。

    public LinkedHashSet(int initialCapacity, float loadFactor) {
        super(initialCapacity, loadFactor, true);
    }


    public LinkedHashSet(int initialCapacity) {
        super(initialCapacity, .75f, true);
    }

    public LinkedHashSet() {
        super(16, .75f, true);
    }


    public LinkedHashSet(Collection<? extends E> c) {
        super(Math.max(2*c.size(), 11), .75f, true);
        addAll(c);
    }

　　从代码中给出的四个构造函数我们可以看出功能各异。我们先来看看简单的构造函数，第一个构造函数制定了两个参数，第二个制定了一个参数，第三个是没有参数设定一个空的构造函数，第四个针对集合的初始化的构造函数。如果我们想要清楚构造函数到底做了什么事情，那么我们需要弄清楚super()方法做了什么事情，以及addAll做了什么事情。看源码：

  HashSet(int initialCapacity, float loadFactor, boolean dummy) {
	map = new LinkedHashMap<E,Object>(initialCapacity, loadFactor);
    }
   public boolean addAll(Collection<? extends E> c) {
	boolean modified = false;
	Iterator<? extends E> e = c.iterator();
	while (e.hasNext()) {
	    if (add(e.next()))
		modified = true;
	}
	return modified;
    }

　　原来这两个方法就是我们构造函数出现的。通过第一个方法HashSet,中有一个Map，那这又是什么呢。原来HashSet中有一个熟悉private transient HashMap<E,Object> map;这下我们明白了原来Set的底层是采用一个Map实现的。这个很重要的东西，通过Map的相关方法调用来模仿Set的功能。Super方法做的事情就是创建了一个指定大小和加载因子的Map，addAll()方法就是遍历这个集合然后依次将他们放入我们的Map中去，从而实现了用一个集合直接构造含有值的Set。

　　回过头来我们看看上面的四个构造方法。第一个方法就是制定了初始容量和加载因子的Set,第二个构造函数就是制定了初始容量的Set,使用系统默认的加载因子0.75。第三个构造函数就是直接调用了一个空的构造函数，默认初始化一个容量为16，加载因子为0.75的Set,最后一个就是使用一个集合初始化Set.

b：iterator（）

public Iterator<E> iterator() {
	return map.keySet().iterator();
    }

　　iterator（），调用它就可以返回Set的迭代对象，底层是采用Map的keySet()方法实现的。

c:size()

 public int size() {
	return map.size();
    }

　　直接返回了Map的容量就得到了Set的元素个数。

d:isEmpty()

 public boolean isEmpty() {
	return map.isEmpty();
    }

　　也是调用map的集合是否为空方法。

e:contains()

   public boolean contains(Object o) {
	return map.containsKey(o);
    }

　　判断是否含有某一个元素。

f:add()

 public boolean add(E e) {
	return map.put(e, PRESENT)==null;
    }

g：remove()和clear()

 public boolean remove(Object o) {
	return map.remove(o)==PRESENT;
    }


    public void clear() {
	map.clear();
    }

　　删除元素的时候就是调用map的方法，clear也是一样。

4.其他（小结）

　　LinkedHashSet集合是根据元素的hashCode值来决定元素的存储位置，但是它同时使用链表维护元素的次序。这样使得元素看起来像是以插入顺序保存的，也就是说，当遍历该集合时候，LinkedHashSet将会以元素的添加顺序访问集合的元素。LinkedHashSet在迭代访问Set中的全部元素时，性能比HashSet好，但是插入时性能稍微逊色于HashSet。Set的很多操作都是依赖Map来实现的，下次来学习下Map的源码相关。

posted on 2014-12-24 19:23 叼烟斗的纤夫阅读(1075) 评论(0) 收藏举报