LinkedHashMap的特殊之处

一、前言

乍眼一看会怀疑或者问LinkedHashMap与HashMap有什么区别？它有什么与众不同之处？由于前面已经有两篇文章分析了HashMap，今天就看看LinkedHashMap。（基于JDK8）

二、结构属性分析

1、继承关系

public class LinkedHashMap<K,V> extends HashMap<K,V> implements Map<K,V>

LinkedHashMap是HashMap的子类，说明HashMap有的功能LinkedHashMap都有。

2、Entery<K, V> head、tail : 双向链表

/**
 * The head (eldest) of the doubly linked list.
 */
transient LinkedHashMap.Entry<K,V> head;

/**
 * The tail (youngest) of the doubly linked list.
 */
transient LinkedHashMap.Entry<K,V> tail;

// Entry没什么特别之处，都是调用父类创建节点的。
static class Entry<K,V> extends HashMap.Node<K,V> {
    Entry<K,V> before, after;
    Entry(int hash, K key, V value, Node<K,V> next) {
        super(hash, key, value, next);
    }
}

3、accessOrder：如果为true，则表示访问有序（新访问的数据会被移至到链尾）。如果为false,表示插入有序。

/**
 * The iteration ordering method for this linked hash map: <tt>true</tt>
 * for access-order, <tt>false</tt> for insertion-order.
 * @serial
 */
private final boolean accessOrder;

这个字段的默认的值是false, 可以从构造函数中看出，当然也可以指定。如下：

public LinkedHashMap() {
    super();
    accessOrder = false;
}
// 指定accessOrder
public LinkedHashMap(int initialCapacity, float loadFactor, boolean accessOrder) {
    super(initialCapacity, loadFactor);
    this.accessOrder = accessOrder;
}

那么什么是插入有序和访问有序呢？都知道在HashMap中是插入或者访问都是无序的。下面我们先通过实例看下这两种情况的效果：

/**
 * 验证插入有序
 */
@Test
public void test_accessOrder_false() {
    // accessOrder 默认为false,表示插入有序
    Map<String, String> map = new LinkedHashMap<>();
    map.put("玉树临枫", "本文作者");
    map.put("Andy", "刘德华");
    map.put("eson", "陈奕迅");
    map.put("张三", "张三");

    for(Map.Entry<String, String> entry : map.entrySet()) {
        System.out.println("key:" + entry.getKey());
    }
}

output: 看下面输出结果，从而知道插入有序表示插入的时间顺序，跟队列的插入顺序一样：先进先出。（如果是HashMap输出是乱序的。）

key:玉树临枫, value:本文作者
key:Andy, value:刘德华
key:eson, value:陈奕迅
key:张三, value:张三

接下来看下访问有序是什么样的：

/**
 * 测试访问有序
 */
@Test
public void test_accessOrder_true() {
    // 指定accessOrder = true
    Map<String, String> map = new LinkedHashMap<>(10, 0.75f, true);
    map.put("玉树临枫", "本文作者");
    map.put("Andy", "刘德华");
    map.put("eson", "陈奕迅");
    map.put("阅读本文的你", "感谢你的支持");

    for(Map.Entry<String, String> entry : map.entrySet()) {
        System.out.println("key:" + entry.getKey() + ", value:" + entry.getValue());
    }
    System.out.println("---------对Andy进行了采访-------------");
    map.get("Andy");
    for(Map.Entry<String, String> entry : map.entrySet()) {
        System.out.println("key:" + entry.getKey() + ", value:" + entry.getValue());
    }
    System.out.println("--------------添加一位成员----------------");
    map.put("James", "23");
    for(Map.Entry<String, String> entry : map.entrySet()) {
        System.out.println("key:" + entry.getKey() + ", value:" + entry.getValue());
    }
}

output: 通过结果可以看出，不过是put操作还是get操作，都会将当前元素移至到链尾。

key:玉树临枫, value:本文作者
key:Andy, value:刘德华
key:eson, value:陈奕迅
key:阅读本文的你, value:感谢你的支持
---------对Andy进行了采访-------------
key:玉树临枫, value:本文作者
key:eson, value:陈奕迅
key:阅读本文的你, value:感谢你的支持
key:Andy, value:刘德华
--------------添加一位成员----------------
key:玉树临枫, value:本文作者
key:eson, value:陈奕迅
key:阅读本文的你, value:感谢你的支持
key:Andy, value:刘德华
key:James, value:23

好奇的朋友肯定想知道它是怎样做到这样的特性，还是得从源码角度去看看。

三、重要函数分析

1、put函数

其实这个函数我们已经在上篇已经分析过了，那么为什么还来看呢？因为LinkedHashMap是HashMap的子类啊，这些都是继承使用的。但有没有发现其中有什么需要注意的呢？再次看下put函数的源码加深下印象。

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    // table为空，则通过扩容来创建，后面在看扩容函数
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    // 根据key的hash值 与 数组长度进行取模来得到数组索引    
    if ((p = tab[i = (n - 1) & hash]) == null)
        // 空链表，创建节点
        tab[i] = newNode(hash, key, value, null);
    else {
        Node<K,V> e; K k;
        // 不为空，则判断是否与当前节点一样，一样就进行覆盖
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        else if (p instanceof TreeNode)
            // 不存在重复节点，则判断是否属于树节点，如果属于树节点，则通过树的特性去添加节点
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else {
            // 该链为链表
            for (int binCount = 0; ; ++binCount) {
                // 当链表遍历到尾节点时，则插入到最后 -> 尾插法
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    // 检测是否该从链表变成树（注意：这里是先插入节点，没有增加binCount,所以判断条件是大于等于阈值-1）
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        // 满足则树形化
                        treeifyBin(tab, hash);
                    break;
                }
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        
        // 存在相同的key, 则替换value
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value；
            // 注意这里，这里是供子类LinkedHashMap实现    
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;
    // 注意细节：先加入节点，再加长度与阈值进行判断，是否需要扩容。
    if (++size > threshold)
        resize();
    // 注意这里，这里是供子类LinkedHashMap实现        
    afterNodeInsertion(evict);
    return null;
}

注意上面逻辑：

每次插入都会调用newNode函数创建一个新节点，对于LinkeHashMap来说有重写该函数。
当存在相同key替换value后，会调用afterNodeAccess函数，这函数在HashMap中是没有任何实现的，主要是供子类LinkeHashMap来实现。

// Callbacks to allow LinkedHashMap post-actions
void afterNodeAccess(Node<K,V> p) { }

当扩容完后，会调用afterNodeInsertion函数，同理这个函数也是供子类LinkeHashMap来实现的。

void afterNodeInsertion(boolean evict) { }

2、newNode()函数

我们看看LinkedHashMap中的newNode()函数的实现，看看多了些什么功能有什么作用。

Node<K,V> newNode(int hash, K key, V value, Node<K,V> e) {
    // 调用父类创建节点， 没什么区别。
    LinkedHashMap.Entry<K,V> p =
        new LinkedHashMap.Entry<K,V>(hash, key, value, e);
    // 新加的方法    
    linkNodeLast(p);
    return p;
}
private void linkNodeLast(LinkedHashMap.Entry<K,V> p) {
    LinkedHashMap.Entry<K,V> last = tail;
    tail = p;
    // 如果双向链表为空，则当前节点是第一个节点
    if (last == null)
        head = p;
    else {
        // 将新创建的节点添加至双向链表的尾部。
        p.before = last;
        last.after = p;
    }
}

从上面看来， LinkedHashMap不仅拥有HashMap的结构和功能，还额外的维护了一套双向链表。另外其插入动作的顺序也知道了：
put() -> putVal() -> newNode() -> linkNodeLast

3、afterNodeAccess函数

void afterNodeAccess(Node<K,V> e) { // move node to last
    LinkedHashMap.Entry<K,V> last;
    // 如果accessOrder=true,即访问有序，且双向链表不止一个节点的时候，进行下面操作：
    if (accessOrder && (last = tail) != e) {
        LinkedHashMap.Entry<K,V> p =
            (LinkedHashMap.Entry<K,V>)e, b = p.before, a = p.after;
        // 将p的后置指针置为null     
        p.after = null; 
        // 如果e的前置指针没有元素, 则直接将双向链表的头节点指向它。
        if (b == null)
            head = a;
        else
            // e的前置指针存在元素, 则将e的前置指针指向节点的后置指针指向其后置指针指向的的节点。
            b.after = a;
        // e的后置指针存在元素, 则将e的后置指针指向节点的前置指针指向e前置指针指向的节点    
        if (a != null)
            a.before = b;
        else
            // 否则将尾节点指向e的前置节点
            last = b;
        // 上面步骤主要是将e节点从链表中移除，然后添加到链表尾部    
        if (last == null)
            head = p;
        else {
            // 添加置链表尾部
            p.before = last;
            last.after = p;
        }
        tail = p;
        ++modCount;
    }
}

从上面函数分析可以看出来，当访问到双向链表存在的值时，如果开启访问有序的开关，则会将访问到的节点移至到双向链表的尾部。另外get函数也会调用这个函数，所以从源码的角度去看问题很清晰。

public V get(Object key) {
    Node<K,V> e;
    if ((e = getNode(hash(key), key)) == null)
        return null;
    // 如果存在节点且开启了访问有序的开关，则会将当前节点移至双向链表尾部    
    if (accessOrder)
        afterNodeAccess(e);
    return e.value;
}

4、afterNodeInsertion函数

该函数表示是否需要删除最年长的节点

void afterNodeInsertion(boolean evict) { // possibly remove eldest
    LinkedHashMap.Entry<K,V> first；
    if (evict && (first = head) != null && removeEldestEntry(first)) {
        // 获取头节点：头节点表示最近很久没有访问的元素
        K key = first.key;
        removeNode(hash(key), key, null, false, true);
    }
}
// 返回false, 所以LinkedHashMap不会有删除年长节点的行为，但其子类可以继承重写该函数。
protected boolean removeEldestEntry(Map.Entry<K,V> eldest) {
    return false;
}

看这个功能有没有想起和某些功能类似呢？ 比如LRUCache : 最近最少使用的缓存淘汰策略。

5、Entry下的forEach函数

public final void forEach(Consumer<? super Map.Entry<K,V>> action) {
    if (action == null)
        throw new NullPointerException();
    int mc = modCount;
    // 遍历的是双向链表。所以我们看到的就是插入的顺序
    for (LinkedHashMap.Entry<K,V> e = head; e != null; e = e.after)
        action.accept(e);
    if (modCount != mc)
        throw new ConcurrentModificationException();
}

四、总结

LinkedHashMap 拥有与 HashMap 相同的底层哈希表结构，即数组 + 单链表 + 红黑树，也拥有相同的扩容机制。
LinkedHashMap 相比 HashMap 的拉链式存储结构，内部额外通过 Entry 维护了一个双向链表。
HashMap 元素的遍历顺序不一定与元素的插入顺序相同，而 LinkedHashMap 则通过遍历双向链表来获取元素，所以遍历顺序在一定条件下等于插入顺序。
LinkedHashMap 可以通过构造参数 accessOrder 来指定双向链表是否在元素被访问后改变其在双向链表中的位置。

posted @ 2019-07-31 19:53 玉树临枫阅读(866) 评论(0) 编辑收藏举报

刷新页面返回顶部

玉树临枫