HashMap源码解析 非原创
Stack过时的类,使用Deque重新实现。
HashCode和equals的关系
HashCode为hash码,用于散列数组中的存储时HashMap进行散列映射。
equals方法适用于比较两个对象是否相同,Object方法的equals方法默认为比较两个对象的地址是否相同
public boolean equals(Object obj) {
return (this == obj);
}
在实际开发中hashcode()和equals()都需要自己重写并且需要保证一下原则
- 两个对象equals(),那么这两个对象的hashcode()一定相等
- 两个对象hashcode相等,其不一定equals(),因为hashcode函数仅仅是做分散,最终还是会发生一定的冲突
可以考虑在集合中,判断两个对象是否相等的规则是:
第一步,如果hashCode()相等,则查看第二步,否则不相等;
第二步,查看equals()是否相等,如果相等,则两obj相等,否则还是不相等。
public static void main(String[] args) {
Object o1 = new Object();
Object o2 = new Object();
System.out.println("hashcode o1 :"+o1.hashCode());
System.out.println("hashcode o2 :"+o2.hashCode());
System.out.println("o1 equals o2 ?"+o1.equals(o2));
}
hashcode o1 :1826771953
hashcode o2 :1406718218
o1 equals o2 ?false
HashMap源码解析:
HashMap的定义:
public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable
继承抽象AbstractMap,实现了Map。
HashMap中重要常量:
//默认容量
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
//最大容量
static final int MAXIMUM_CAPACITY = 1 << 30;
//默认加载因子
static final float DEFAULT_LOAD_FACTOR = 0.75f;
//链表转成红黑树的阈值
static final int TREEIFY_THRESHOLD = 8;
//红黑树转为链表的阈值
static final int UNTREEIFY_THRESHOLD = 6;
//存储方式由链表转成红黑树的容量的最小阈值
static final int MIN_TREEIFY_CAPACITY = 64;
//HashMap中存储的键值对的数量
transient int size;
//扩容阈值,当size>=threshold时,就会扩容
int threshold;
//HashMap的加载因子
final float loadFactor;
需要指出的是这里loadFactor加载因子在初始化后就不能变更。加载因子也可以叫做扩充因子----毕竟只是拿来判断是否扩容的嘛(#.#)。
初始化HashMap
Map<K,V> map = new HashMap<K,V>();
或者 Map<K,V> map = new HashMap<K,V>(31)
实际调用的代码
public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
this(initialCapacity,DEAULT_LOAD_FACTOR);
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity);
}
在初始化中会判断,初始化参数是否小于0,抛出IllegalArgumentException();如果HashMap的最大容量MAXIMUM_CAPACITY(也就是2的32次方 ,为什么是2的32次方呢? ),在确定threhold扩容阈值。
细心的同学可能注意到HashMap中所有常量的定义都是int型,Java中int型是32位的。
接下来就是对tableSizeFor的解释:
/**
* Returns a power of two size for the given target capacity.
*/
static final int tableSizeFor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
源代码中注释的写的是获取与cap最相近的2的幂。
例如 32 会产生32 而33就会产生64,这个式子很神奇,为什么正确,我也不太明了o(╥﹏╥)o。
Hash()方法
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
^是异或操作 1^1 =0 ;1^0 = 1; 0^1 =1 ;0^0=0; 多位的异或,比如3^2 = 1 (11^10 = 01);
这里需要解释的是,如果(h = key.hashCode())^(h>>>16) 是取h的低16位与高16为进行异或作为低16位与h的高16位进行拼接,得到最后的hash值。 据说能够提高hash的分散程度。嘤嘤嘤。
还有提到一点就是HashSet内部是使用HashMap实现的;这个在解析HashSet的时候会详细提到;
/** HashSet的Add的方法 */ public boolean add(E e) { return map.put(e, PRESENT)==null; }
HashSet核心方法
putVal()方法
源码:
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
我们慢慢来分析。首先看入参:
- hash:表示key的hash值
- key:待存储的key值
- value:待存储的value值,从这个方法可以知道,HashMap底层存储的是key-value的键值对,不只是存储了value
- onlyIfAbsent:这个参数表示,是否需要替换相同的value值,如果为true,表示不替换已经存在的value
- evict:如果为false,表示数组是新增模式
我们看到put时所传入的参数put(hash(key), key, value, false, true),可以得到相应的含义。
作者:端木轩
链接:https://www.jianshu.com/p/7dcff1fd05ad
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。
HashMap中的数据结构
在继续下一步分析之前,我们首先需要看一下HashMap底层的数据结构。
HashMap的数据结构
我们可以看到,HashMap底层是数组加单向链表或红黑树实现的(这是JDK 1.8里面的内容,之前的版本纯粹是数组加单向链表实现)。
回到最骚气的putVal()
Node<K,V>[] tab; Node<K,V> p; int n, i;
Node<K,V>[] tab 用于引用table也就是hash表;
Node<K,V> p 用于指向需要指向红黑树或者链表;
int n 用于存储当前table的长度;
int i 用于存储当前访问的table索引;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
如果表为空或这表的长度为零重新分配表;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
如果当前访问的桶为空,初始化一个新的节点
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
当前的hash值等于。。。
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
当前访问的桶是红黑树,将该值放入红黑树中;
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
如果桶是空的,将节点添加到链表后面,如果当前链表长度大于TREEIFY_THRESHOLD将当前链表转化为红黑树。
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
如果当前key不为空,并且开启了替换模式,将值直接替掉;
++modCount;
if (++size > threshold)
resize();
当前值大小大于阈值,将当前大小重新定制;到此,最核心的putVal()就浅显的将完成了,虽然还有很多的疑惑为解决;
// Callbacks to allow LinkedHashMap post-actions void afterNodeAccess(Node<K,V> p) { } void afterNodeInsertion(boolean evict) { } void afterNodeRemoval(Node<K,V> p) { }
在代码中这三个方法体时为空的,用于LinkedHashMap的操作;
参考内容:
作者:端木轩
链接:https://www.jianshu.com/p/7dcff1fd05ad
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。