HashSet底层存储元素的源码分析
此类实现 Set 接口,由哈希表(实际上是一个 HashMap 实例)支持。它不保证 set 的迭代顺序;特别是它不保证该顺序恒久不变。此类允许使用 null 元素。
HashSet<String> set = new HashSet<String>();
set.add("abc");
1 private transient HashMap<E,Object> map; 2 /** 7 * Constructs a new, empty set; the backing <tt>HashMap</tt> instance has 8 * default initial capacity (16) and load factor (0.75). 9 */ 10 public HashSet() { 11 map = new HashMap<>(); 12 }
点击
HashSet
进入 看Hash源码,证明 它确实是 由一个 HashMap 实例支持。
众所周知,set是无序,不重复的。那么它是如何保证元素唯一性的呢?
先看源码。点击 add方法进入。
public boolean add(E e) { return map.put(e, PRESENT)==null; }
public V put(K key, V value) { return putVal(hash(key), key, value, false, true); }
1 final V putVal(int hash, K key, V value, boolean onlyIfAbsent, 2 boolean evict) { 3 Node<K,V>[] tab; Node<K,V> p; int n, i; 4 if ((tab = table) == null || (n = tab.length) == 0) 5 n = (tab = resize()).length; 6 if ((p = tab[i = (n - 1) & hash]) == null) 7 tab[i] = newNode(hash, key, value, null); 8 else { 9 Node<K,V> e; K k; 10 if (p.hash == hash && 11 ((k = p.key) == key || (key != null && key.equals(k)))) 12 e = p; 13 else if (p instanceof TreeNode) 14 e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); 15 else { 16 for (int binCount = 0; ; ++binCount) { 17 if ((e = p.next) == null) { 18 p.next = newNode(hash, key, value, null); 19 if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st 20 treeifyBin(tab, hash); 21 break; 22 } 23 if (e.hash == hash && 24 ((k = e.key) == key || (key != null && key.equals(k)))) 25 break; 26 p = e; 27 } 28 } 29 if (e != null) { // existing mapping for key 30 V oldValue = e.value; 31 if (!onlyIfAbsent || oldValue == null) 32 e.value = value; 33 afterNodeAccess(e); 34 return oldValue; 35 } 36 } 37 ++modCount; 38 if (++size > threshold) 39 resize(); 40 afterNodeInsertion(evict); 41 return null; 42 }
1 static final int hash(Object key) { 2 int h; 3 return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); 4 }
通过以上源码,可以发现为保证唯一性。
1.将传入的元素进行hashCode方法调用,得到该元素的hash值。拿到hash值还需要和数组的长度进行运算,获取元素存储的下标值。
获取元素存储的下标值,尝试将传入的元素存储到对应的下标中。
2.如果计算出来的下标中,不存在元素,则直接存储。否则执行第3步的equals方法。
3.如果存储对象的equals方法返回true,说明是一样的,所以不存。如果返回false,说明不一样,要存储起来。
4.使用“单链表”将存储数据链接起来。
那么单链表是什么样子的代码呢?
Node<K,V> next; 这就是单链表的数据结构
1 static class Node<K,V> implements Map.Entry<K,V> { 2 final int hash; 3 final K key; 4 V value; 5 Node<K,V> next; 6 7 Node(int hash, K key, V value, Node<K,V> next) { 8 this.hash = hash; 9 this.key = key; 10 this.value = value; 11 this.next = next; 12 } 13 14 public final K getKey() { return key; } 15 public final V getValue() { return value; } 16 public final String toString() { return key + "=" + value; } 17 18 public final int hashCode() { 19 return Objects.hashCode(key) ^ Objects.hashCode(value); 20 } 21 22 public final V setValue(V newValue) { 23 V oldValue = value; 24 value = newValue; 25 return oldValue; 26 } 27 28 public final boolean equals(Object o) { 29 if (o == this) 30 return true; 31 if (o instanceof Map.Entry) { 32 Map.Entry<?,?> e = (Map.Entry<?,?>)o; 33 if (Objects.equals(key, e.getKey()) && 34 Objects.equals(value, e.getValue())) 35 return true; 36 } 37 return false; 38 } 39 }
这个就是hashSet的存储图。其中红色的线就是链表线。
这个单链表具体长这样的:
最后结论:HashSet底层依赖HashMap来实现。使用Node数组与单链表来实现元素的存储。
ps:听说jdk1.8以后当单链表大于8的长度时,会添加红黑树来实现。