HashMap源码解析

HashMap

// 业务代码
HashMap<String,Integer> map = new HashMap<>();
for (int i = 0; i < 17; i++) 
    map.put("add"+i,1);

put 方法

transient Node<K,V>[] table;
transient Set<Map.Entry<K,V>> entrySet;
transient int size;

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}

// 计算hash值，HashMap基于原来的hashCode又包了一层操作
static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

/**
  * Implements Map.put and related methods.
  * 
  * @param hash key的hash值
  * @param key key
  * @param value 传入的value
  * @param onlyIfAbsent 若为true，不修改已存在的value
  * @param evict 如果为false，此table表处于创建模式
  * @return previous value, or null if none
  */
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {
    Node<K,V>[] tab;
    Node<K,V> p;
    int n, i;
    // 将table赋给tab，table.length赋值给n，判断table是否为null，或者table的length是否为0
    if ((tab = table) == null || (n = tab.length) == 0)
        // 第一次调用put，进入此if，第一次调用resize()方法把table初始化成长度为16的数组
        n = (tab = resize()).length;
    // 长度和n-1做与运算；结果赋值给i，这一步计算的目的：判断在HashMap的table数组中查找给定hash对应的桶（bucket）位置是否已有元素存在
    if ((p = tab[i = (n - 1) & hash]) == null)
        // 桶位置无元素，则赋值
        tab[i] = newNode(hash, key, value, null);//赋值：tab[0] = 新节点
    else {
        // 桶位置有元素
        第一次调用put，这里不会进，为节省篇幅故省略
        ... 
    }
    ++modCount;//操作计数+1
    // size是否超过阈值，第一次调用肯定是不会超过的，故不进此if
    if (++size > threshold)
        resize();
    afterNodeInsertion(evict);//这个方法未在HashMap中具体实现
    return null;
}

第一次调用 resize 方法

static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;// 默认初始容量：16
static final float DEFAULT_LOAD_FACTOR = 0.75f;//默认负载系数

final Node<K,V>[] resize() {
        Node<K,V>[] oldTab = table;// 用一个局部变量oldTab记录table
        int oldCap = (oldTab == null) ? 0 : oldTab.length;//判断table是否为null，第一次调用resize肯定为null，故oldCap = 0
        int oldThr = threshold;//阈值也为0，因为此时threshold还未被计算
        int newCap, newThr = 0;
        if (oldCap > 0) {
            第一次调用，不会进此if
            ...
        }
        else if (oldThr > 0) // initial capacity was placed in threshold
            newCap = oldThr;
        else {               // zero initial threshold signifies using defaults
            newCap = DEFAULT_INITIAL_CAPACITY;//以默认初始容量 赋值给newCap
            newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);// 计算默认阈值12=负载系数*默认初始容量
        }
        if (newThr == 0) {
           第一次调用，不会进此if
           ...
        }
        threshold = newThr;
        @SuppressWarnings({"rawtypes","unchecked"})
        // 生成一个长度为16的数组赋值给table，并返回
        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
        table = newTab;
        if (oldTab != null) {
            第一次调用，不会进此if
            ...
        }
        return newTab;
    }

newNode 创建node节点并返回

Node<K,V> newNode(int hash, K key, V value, Node<K,V> next) {
    return new Node<>(hash, key, value, next);
}

撸完第一遍HashMap的源码，可知HashMap的主枝干就是一个Node<K,V>[] table的数组，此数组的每个下标用另一种称谓——桶，桶是一个很抽象难以理解的词，习惯就好。
如果计算出的桶位置不存在数据，那么HashMap的处理方式是直接赋值。但是第一次仅仅初始化了一个容量为16的Node<K,V>[] table数组，如果后续超过16个元素是不是
就意味着无法添加了呢？其实不然，从源码可知：添加元素并不以Node<K,V>[] table的容量来判断，而是以threshold阈值进行判断。就是说如果添加的元素总量超过值域，
那么HashMap中的Node<K,V>[] table数组就会迎来一次调整（这个调整的工作由resize()实现）。

见 putVal的如下代码段

++modCount;//操作计数+1
// size超过值域，调整table
if (++size > threshold)
    resize();
afterNodeInsertion(evict);
return null;

resize()

static final int MAXIMUM_CAPACITY = 1 << 30; // 1073741024


final Node<K,V>[] resize() {
    Node<K,V>[] oldTab = table;// 获取table
    int oldCap = (oldTab == null) ? 0 : oldTab.length;// 得到table的长度
    int oldThr = threshold;// 原阈值12
    int newCap, newThr = 0;
    if (oldCap > 0) {
        // 判断table长度是否超过最大限制（1073741024），显然目前还没有超过，不会进此if
        if (oldCap >= MAXIMUM_CAPACITY) {
            //超过最大限制，赋值Integer.MAX_VALUE给 阈值
            threshold = Integer.MAX_VALUE;// 2147483267
            return oldTab;
        }
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY)
            /**
             * 通过判断容量计算阈值：
             * 判断 将table扩大一倍的长度 是否小于最大限制（1073741024）并且 table长度 大于等于初始化时的16大小，
             * 如果满足条件，则将阈值扩大一倍【这里并没有直接赋值，而是计算出阈值大小】
             * 注意：newCap值被修改！(newCap = oldCap << 1)
             * */
            newThr = oldThr << 1; // double threshold
    }
    else if (oldThr > 0) // initial capacity was placed in threshold 不会进此else if
        newCap = oldThr;
    else {               // zero initial threshold signifies using defaults 不会进此else
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    //不会进此if，此时newThr代表的阈值已经被扩大一倍，不可能为0
    if (newThr == 0) {
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    threshold = newThr;//更新阈值
    @SuppressWarnings({"rawtypes","unchecked"})
    Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];//生成新的数组，并赋给newTab
    table = newTab;//将newTab赋值给table，此时的HashMap中table就是一个具有一定长度的空数组了
    if (oldTab != null) {
        // 循环遍历旧数组，因为需要把原数组的数据转移到新数组中
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            // 为e赋值oldTab[j]，并判断是否为空
            if ((e = oldTab[j]) != null) {
                oldTab[j] = null;// 清空旧数组的桶里的数据
                if (e.next == null)
                    // 判断Node节点是否有子节点，如果没有证明此桶下没有treeNode或链表，进if，计算桶位置，并把旧数据赋值到新数组中
                    newTab[e.hash & (newCap - 1)] = e;
                else if (e instanceof TreeNode)
                    // 判断旧数据的桶 是否是树节点，如果是调用split处理（split源码不做解释了）
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                else { // preserve order
                    // 上面两个判断都没有进，证明当前桶是带链表的结构
                    Node<K,V> loHead = null, loTail = null;
                    Node<K,V> hiHead = null, hiTail = null;
                    Node<K,V> next;
                    // 用while循环处理旧桶里的链表数据，写注释太影响阅读了，所以我把这段代码的解释放在了下面
                    do {
                        next = e.next;
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        }
                        else {
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    if (loTail != null) {
                        loTail.next = null;
                        newTab[j] = loHead;
                    }
                    if (hiTail != null) {
                        hiTail.next = null;
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;
}

next = e.next; 保存当前元素e的下一个元素的引用，以便在循环的下一轮中继续处理。

(e.hash & oldCap) == 0：这个条件用于判断元素e在新table数组中的位置是“低位”还是“高位”。由于oldCap是原table数组的长度（假设是2的幂），e.hash & oldCap实际上就是检查e的哈希值的某个特定位（对应于oldCap的最低位）是0还是1。

如果(e.hash & oldCap) == 0，则e应该被放入新table数组的“低位”部分。
如果(e.hash & oldCap) != 0，则e应该被放入新table数组的“高位”部分。
接下来的代码块分别处理“低位”和“高位”的情况，将元素添加到对应的链表（或红黑树）中：

对于“低位”部分：

如果loTail（表示“低位”链表的尾节点）为null，则将e设置为loHead（即链表的头节点）。
否则，将e添加到“低位”链表的末尾，并更新loTail。
对于“高位”部分：

如果hiTail（表示“高位”链表的尾节点）为null，则将e设置为hiHead（即链表的头节点）。
否则，将e添加到“高位”链表的末尾，并更新hiTail。
while ((e = next) != null);：这是一个do-while循环，用于遍历原table数组中的当前链表（或红黑树）的所有元素，直到没有更多的元素（即next为null）为止。

链表转红黑树

putVal

static final int TREEIFY_THRESHOLD = 8;

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {
        ...
            else {
                for (int binCount = 0; ; ++binCount) {
                    // 以binCount计数，这个局部变量将决定是否将链表转为红黑树
                    if ((e = p.next) == null) {
                        // 因为next==null，所以可以断定进入此if，这时遍历至最后一个链表节点
                        p.next = newNode(hash, key, value, null);
                        // 判断binCount是否≥7（binCount是以0开始累加的，所以说只要链表长度达到8，就会转红黑树）
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;//当前节点赋给p，供下次循环使用p
                }
            }
        ...
    }

由此可见：HashMap采用的是红黑树+链表+数组实现的。HashMap的方法中并没用锁和其他支持多线程的技术，故HashMap是线程不安全的类。

值得注意的是在HashMap的源码中，并没有直接实现从红黑树转回链表的代码。这是因为一旦某个桶的链表转换为了红黑树，HashMap不会将其自动转换回链表，即使后来链表的长度减少到了阈值以下

posted @ 2024-05-07 18:57 勤匠阅读(33) 评论(0) 收藏举报

刷新页面返回顶部

不积跬步无以至千里，不积小流无以成江河

技术人的一生没有捷径，每一步都需要自己去走

HashMap源码解析

HashMap

put 方法

链表转红黑树

公告