深入理解java集合框架之---------HashMap集合

深入理解HaspMap死循环问题

由于在公司项目中偶尔会遇到HashMap死循环造成CPU100%，重启后问题消失，隔一段时间又会反复出现。今天在这里来仔细剖析下多线程情况下HashMap所带来的问题：

1、多线程put操作后，get操作导致死循环。

2、多线程put非null元素后，get操作得到null值。

3、多线程put操作，导致元素丢失。

死循环场景重现

下面我用一段简单的DEMO模拟HashMap死循环:

public class Test extends Thread
{
    static HashMap<Integer, Integer> map = new HashMap<Integer, Integer>(2);
    static AtomicInteger at = new AtomicInteger();
    
    public void run()
    {
        while(at.get() < 100000)
        {
            map.put(at.get(),at.get());
            at.incrementAndGet();
        }
    }

　　其中map和at都是static的，即所有线程所共享的资源。接着5个线程并发操作该HashMap：

public static void main(String[] args)
     {
         Test t0 = new Test();
         Test t1 = new Test();
         Test t2 = new Test();
         Test t3 = new Test();
         Test t4 = new Test();
         t0.start();
         t1.start();
         t2.start();
         t3.start();
         t4.start();
     }

　　反复执行几次，出现这种情况则表示死循环了：

　　接下来我们去查看下CPU以及堆栈情况：

　　通过堆栈可以看到：Thread-3由于HashMap的扩容操作导致了死循环。

正常的扩容过程

我们先来看下单线程情况下，正常的rehash过程

1、假设我们的hash算法是简单的key mod一下表的大小（即数组的长度）。

2、最上面是old hash表，其中HASH表的size=2，所以key=3,5,7在mod 2 以后都冲突在table[1]这个位置上了。

3、接下来HASH表扩容，resize=4，然后所有的<key,value>重新进行散列分布，过程如下：

在单线程情况下，一切看起来都很美妙，扩容过程也相当顺利。接下来看下并发情况下的扩容。

并发情况下的扩容

1、首先假设我们有两个线程，分别用红色和蓝色标注了。

2、扩容部分的源代码：

void transfer(Entry[] newTable) {
        Entry[] src = table;
        int newCapacity = newTable.length;
        for (int j = 0; j < src.length; j++) {
            Entry<K,V> e = src[j];
            if (e != null) {
                src[j] = null;
                do {
                    Entry<K,V> next = e.next;
                    int i = indexFor(e.hash, newCapacity);
                    e.next = newTable[i];
                    newTable[i] = e;
                    e = next;
                } while (e != null);
            }
        }
    }

　　3、如果在线程一执行到第9行代码就被CPU调度挂起，去执行线程2，且线程2把上面代码都执行完毕。我们来看看这个时候的状态：