HashMap中的哈希函数分析

首先我们要知道，在理想情况下的哈希表中，哈希函数生成的哈希值是value在数组中的下标，其范围是分布于负无穷到正无穷的整个实整数轴的。而在现实情况下，是不可能存在这么大的一个数组的。接下来分析HashMap怎么处理：
HashMap的put方法：

public V put(K key, V value) {
   return putVal(hash(key), key, value, false, true);
}

put方法使用的不是Object提供的key.hashcode()，而是hash(key)：

static final int hash(Object key) {
	int h;
	return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

在key!=0的情况下，进行一下拆解分析：

static final int hash(Object key) {
    int h = key.hashCode();
    int l = h>>>16;
    return h^l;
}

先取Object.hashcode()，是32位；然后右移16位，将低16位丢弃；将hashCode的低16位与高16位进行按位异或运算然后返回。
这就是扰动函数，扰动函数是如何减少冲突的？
由开头的分析，我们知道HashMap是不可能使用直接的哈希值的，因为不可能一个HashMap就要分配无限大（或者2^32次方大）的数组空间。
因此实际上HashMap是将哈希值对当前数组长度取余：

//源码部分截取
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);

看tab[i = (n - 1) & hash]这里，HashMap在数组中的实际下标其实是 (数组长度-1)&hash，其实就是hash%数组长度。
以初始长度16为例，一个哈希值分布于整个实整数轴，取余16之后，必然分布于[0,15]区间范围内，也就无需去分配无限大的数组空间了。
这样做有什么问题呢？
一个好的哈希函数，要做到生成的哈希值足够分散。但是对数组长度取余后，相当于只截取了低位（因为HashMap的容量总是16的整数倍）。
如果一个key的哈希值的低四位是0010，那么在取余16之后，就只剩下0010，也就是十进制2。
哈希函数可能设计得在低位不是那么地随机，那么只保留低位的效果，就相当于完全抛弃了高位的随机性，因此需要这样的扰动函数，将高位与低位进行运算，增强低位的随机性。
在这篇文章中《An introduction to optimising a hashing strategy》，对比发现，采用高位扰动低位的方式进行hash，会使得哈希冲突减少10%。
顺便分析一下为什么HashMap的容量总是2的幂次方
首先HashMap的初始容量是16，随后每当实际容量占到了扩容因子*最大容量后，容量扩大为当前的两倍。因此HashMap的容量总是16*2的幂次方。
之前说得hashcode取余数组长度，只有在数组长度为2的幂次方的情况下，才可以转为(n - 1) & hash的位运算，从而提高运算效率。