HashSet底层存储元素的源码分析

此类实现 Set 接口，由哈希表（实际上是一个 HashMap 实例）支持。它不保证 set 的迭代顺序；特别是它不保证该顺序恒久不变。此类允许使用 null 元素。

HashSet<String> set = new HashSet<String>();
set.add("abc");

 1      private transient HashMap<E,Object> map;
 2     /**
 7      * Constructs a new, empty set; the backing <tt>HashMap</tt> instance has
 8      * default initial capacity (16) and load factor (0.75).
 9      */
10     public HashSet() {
11         map = new HashMap<>();
12     }

点击

HashSet

进入看Hash源码，证明它确实是由一个 HashMap 实例支持。

众所周知，set是无序，不重复的。那么它是如何保证元素唯一性的呢？

先看源码。点击 add方法进入。

public boolean add(E e) {
        return map.put(e, PRESENT)==null;
    }

public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }

 1 final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
 2                    boolean evict) {
 3         Node<K,V>[] tab; Node<K,V> p; int n, i;
 4         if ((tab = table) == null || (n = tab.length) == 0)
 5             n = (tab = resize()).length;
 6         if ((p = tab[i = (n - 1) & hash]) == null)
 7             tab[i] = newNode(hash, key, value, null);
 8         else {
 9             Node<K,V> e; K k;
10             if (p.hash == hash &&
11                 ((k = p.key) == key || (key != null && key.equals(k))))
12                 e = p;
13             else if (p instanceof TreeNode)
14                 e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
15             else {
16                 for (int binCount = 0; ; ++binCount) {
17                     if ((e = p.next) == null) {
18                         p.next = newNode(hash, key, value, null);
19                         if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
20                             treeifyBin(tab, hash);
21                         break;
22                     }
23                     if (e.hash == hash &&
24                         ((k = e.key) == key || (key != null && key.equals(k))))
25                         break;
26                     p = e;
27                 }
28             }
29             if (e != null) { // existing mapping for key
30                 V oldValue = e.value;
31                 if (!onlyIfAbsent || oldValue == null)
32                     e.value = value;
33                 afterNodeAccess(e);
34                 return oldValue;
35             }
36         }
37         ++modCount;
38         if (++size > threshold)
39             resize();
40         afterNodeInsertion(evict);
41         return null;
42     }

1 static final int hash(Object key) {
2         int h;
3         return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
4     }

通过以上源码，可以发现为保证唯一性。

1.将传入的元素进行hashCode方法调用，得到该元素的hash值。拿到hash值还需要和数组的长度进行运算，获取元素存储的下标值。

获取元素存储的下标值，尝试将传入的元素存储到对应的下标中。

2.如果计算出来的下标中，不存在元素，则直接存储。否则执行第3步的equals方法。

3.如果存储对象的equals方法返回true，说明是一样的，所以不存。如果返回false，说明不一样，要存储起来。

4.使用“单链表”将存储数据链接起来。

那么单链表是什么样子的代码呢？

Node<K,V> next; 这就是单链表的数据结构

 1  static class Node<K,V> implements Map.Entry<K,V> {
 2         final int hash;
 3         final K key;
 4         V value;
 5         Node<K,V> next;
 6 
 7         Node(int hash, K key, V value, Node<K,V> next) {
 8             this.hash = hash;
 9             this.key = key;
10             this.value = value;
11             this.next = next;
12         }
13 
14         public final K getKey()        { return key; }
15         public final V getValue()      { return value; }
16         public final String toString() { return key + "=" + value; }
17 
18         public final int hashCode() {
19             return Objects.hashCode(key) ^ Objects.hashCode(value);
20         }
21 
22         public final V setValue(V newValue) {
23             V oldValue = value;
24             value = newValue;
25             return oldValue;
26         }
27 
28         public final boolean equals(Object o) {
29             if (o == this)
30                 return true;
31             if (o instanceof Map.Entry) {
32                 Map.Entry<?,?> e = (Map.Entry<?,?>)o;
33                 if (Objects.equals(key, e.getKey()) &&
34                     Objects.equals(value, e.getValue()))
35                     return true;
36             }
37             return false;
38         }
39     }

这个就是hashSet的存储图。其中红色的线就是链表线。

这个单链表具体长这样的：

最后结论：HashSet底层依赖HashMap来实现。使用Node数组与单链表来实现元素的存储。

ps:听说jdk1.8以后当单链表大于8的长度时，会添加红黑树来实现。

posted on 2018-05-25 11:05 伪全栈的java工程师阅读(973) 评论(0) 收藏举报