【Java集合】LinkedList的使用及原理

前言

在【Java集合】ArrayList的使用及原理中，我们介绍了关于ArrayList的相关原理。无论是在面试还是在平时应用中，我们经常将LinkedList与ArrayList进行比较，因为他们虽然都是List主力军，但因其结构的不同，其应用场景也不太相同。本文首先对LinkedList的原理进行介绍，而后再介绍二者的不同。（本文中若无特地说明，LinkedList版本基于JDK 1.8）。

（若文章有不正之处，或难以理解的地方，请多多谅解，欢迎指正）

LinkedList的继承关系

在这里插入图片描述

如何定义一个LinkedList？

LinkedList有两个构造函数：① 无参； ②参数为集合。

举个栗子：

//默认创建一个LinkedList
LinkedList<String> l1 = new LinkedList<>();
//创建一个将其他类型集合中的数据化为己用的LinkedList
LinkedList<String> l2 = new LinkedList<>(new HashSet<>());

在了解LinkedList的源码之前，我们先看看LinkedList的属性：

transient int size = 0;

    /**
     * Pointer to first node.
     * Invariant: (first == null && last == null) ||
     *            (first.prev == null && first.item != null)
     */
transient Node<E> first;

    /**
     * Pointer to last node.
     * Invariant: (first == null && last == null) ||
     *            (last.next == null && last.item != null)
     */
 transient Node<E> last;

transient关键词的用处在于该类的对象序列化时，被transient修饰的属性并不参与序列化，详情可以参考之前的文章：《你真的有好好了解过序列化吗：Java序列化实现的原理》。可以看到，LinkedList主要是由若干节点连接而成，有两个终端节点，一个在起始位置，另一个在终点位置，并且还有一个属性size记录整个LinkedList中的节点数。

至于Node节点，我们来观察它的结构。

Node节点

private static class Node<E> {
        E item;
        Node<E> next;
        Node<E> prev;

        Node(Node<E> prev, E element, Node<E> next) {
            this.item = element;
            this.next = next;
            this.prev = prev;
        }
    }

在Node节点中有定义了前一个节点和后一个节点，即一个节点既可以找到向前和向后方向的结点，所以可以初步判断，LinkedList内部维护了一个双向链表。其中，item变量保存的是当前节点的值，通过next变量指向前一个节点，通过prev变量指向后一个节点。

接下来我们来看定义ArrayList的两种构造函数。

LinkedList无参构造函数

 public LinkedList() {}

你没看错，LinkedList的无参构造函数就是什么操作都没有，因为其类的定义属性中已经包含了LinkedList初始化时需要的一切——终端节点、节点个数。这也就意味着，LinkedList类的重点在于节点的构成以及节点之间的操作。

LinkedList有参构造函数——入参类型为集合类

/**
     * Constructs a list containing the elements of the specified
     * collection, in the order they are returned by the collection's
     * iterator.
     * ......
     */
    public LinkedList(Collection<? extends E> c) {
        this();
        addAll(c);
    }

暂且不去看addAll()方法的内部实现，仅通过注释可以知道，在通过集合类来构造LinkedList的过程中，是会通过集合类中通用的iterator来进行遍历，然后挨个加入到LinkedList中。

怎么使用LinkedList？

我们已经知道了如何去定义一个LinkedList，而且上文也提到过LinkedList中节点之间的操作是重点，接下来我们来介绍下LinkedList中常用的方法：get、add、addAll等。

get(int index)

ArrayList的底层是Object数组，所以ArrayList进行随机读取的速度很快，而LinkedList的底层结构决定了它在随机读取数据上比不上ArrayList。

 public E get(int index) {
        checkElementIndex(index);
        return node(index).item;
    }

可以看到，在获取元素之前会先对index进行**checkElementIndex()元素下标检查，然后再通过node()**取出相关节点，再获取到该节点中存储的数据。

checkElementIndex()

private void checkElementIndex(int index) {
    if (!isElementIndex(index))
    	throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}

private boolean isElementIndex(int index) {
	return index >= 0 && index < size;
}

在检查下标的时候，需要通过size来进行判断。

node()

Node<E> node(int index) {
        // assert isElementIndex(index);

        if (index < (size >> 1)) {
            Node<E> x = first;
            for (int i = 0; i < index; i++)
                x = x.next;
            return x;
        } else {
            Node<E> x = last;
            for (int i = size - 1; i > index; i--)
                x = x.prev;
            return x;
        }
    }

在这里可以看到，node()方法中会先对传入的索引参数index与LinkedList长度size/2进行比较。如果index>=size/2，那么说明节点在LinkedList的后半段，从后往前找会更加省时；如果index<size/2，说明节点在LinkedList的前半段，从第一个节点顺序遍历，会更加容易找。

但如果这个数越靠近中间，那么get()方法遍历的时间也越长，效率也越低。而且随着LinkedList中的节点数量越来越大，get()的执行性能也会迅速下降。所以在使用LinkedList时，可以使用getFirst()、getLast()方法，直接调用类中的first和last变量。

add(E e)

ArrayList在将元素添加至数组中间位置的时候，需要将位置后的所有元素向后移动一位。LinkedList虽然没有随机存取的特性，但增删节点的操作比ArrayList轻松很多。我们来看看LinkedList的添加操作：

public boolean add(E e) {
        linkLast(e);
        return true;
    }

void linkLast(E e) {
        final Node<E> l = last;
        final Node<E> newNode = new Node<>(l, e, null);
        last = newNode;
        if (l == null)
            first = newNode;
        else
            l.next = newNode;
        size++;
        modCount++;
    }

从源码中可以看出LinkedList在添加元素时，会用节点的形式将数据包装起来，并利用其前后节点定义该节点，最后再根据LinkedList的last末尾节点的状态来决定此节点的位置。如果LinkedList集合为空，则该节点被设置为LinkedList对象的首节点；如果LinkedList集合不为空，则该节点被设为LinkedList对象的尾节点。

分三种情况来了解add()的节点添加情景：

假如我们要向空LinkedList菜单集合中添加"小笼包"，则这个节点既是首节点，也是尾节点：
假如我们要向非空LinkedList菜单集合中添加“奶黄包”，则这个节点就是尾节点last，且下一个节点next为null。
加入通过add(1, “叉烧包”)这种方式将元素添加到LinkedList中，则需要找到这个下标代表的元素，并将这个元素以及该元素后的节点作为"叉烧包"节点的前后节点。

public void add(int index, E element) {
        checkPositionIndex(index);

        if (index == size)
            linkLast(element);
        else
            linkBefore(element, node(index));
    }

从源码中我们可以看到，在进行添加操作之前，会将传入的索引进行范围检查后，再比较索引与当前LinkedList对象的size的大小，选择节点插入的位置。

void linkLast(E e) {
        final Node<E> l = last;
        final Node<E> newNode = new Node<>(l, e, null);
        last = newNode;
        if (l == null)
            first = newNode;
        else
            l.next = newNode;
        size++;
        modCount++;
    }

如果索引index等于size，则说明该节点需要放在LinkedList对象的末尾。如果索引index不等于size，则需要调用node()方法找到索引对应的节点，与元素一起作为调用linkBefore()的参数：

void linkBefore(E e, Node<E> succ) {
        // assert succ != null;
        final Node<E> pred = succ.prev;
        final Node<E> newNode = new Node<>(pred, e, succ);
        succ.prev = newNode;
        if (pred == null)
            first = newNode;
        else
            pred.next = newNode;
        size++;
        modCount++;
    }

可以看到，这个过程与add(int index)的没有本区区别，都是通过建立一个新的Node节点，并且指定其prev和next来实现，不同点在于需要调用node()来指定插入的位置，这里需要遍历链表才能获得，也是比较耗时的一个过程。
在这里插入图片描述
可以看到，在ArrayList中插入数据可能有的数组扩容和数据元素移动造成的开销，在LinkedList都不需要，所以相比ArrayList，LinkedList的插入效率比较高。除了add()之外，比较常用的添加方法还有addFirst()和addLast()。

remove(Object o)和remove(int index)

在上文我们介绍了LinkedList增加节点的方法，是通过链表上节点的prev和next变量来进行节点之间的连接。所以LinkedList移除节点也是在prev和next变量中来调节点与点之间的关系。

remove(Object o)

public boolean remove(Object o) {
    if (o == null) {
        for (Node<E> x = first; x != null; x = x.next) {
            if (x.item == null) {
                unlink(x);
                return true;
            }
        }
    } else {
        for (Node<E> x = first; x != null; x = x.next) {
            if (o.equals(x.item)) {
                unlink(x);
                return true;
            }
        }
    }
    return false;
}

从源码中我们可以看出，LinkedList也可以添加值为null的节点，但其实除了要判断值为null之外，两个代码块的操作是一样的，需要将所有节点遍历一遍直到确认值为入参o是否在LinkedList链表中。如果找到了，则通过**unlink()**方法将值为o的节点移除链表。

    E unlink(Node<E> x) {
        // assert x != null;
        final E element = x.item;
        final Node<E> next = x.next;
        final Node<E> prev = x.prev;

        if (prev == null) {
            first = next;
        } else {
            prev.next = next;
            x.prev = null;
        }

        if (next == null) {
            last = prev;
        } else {
            next.prev = prev;
            x.next = null;
        }

        x.item = null;
        size--;
        modCount++;
        return element;
    }

在unlink()方法中可以看到，在将该节点x的前节点的后指针指向x的后节点，将x的后节点的前指针指向x的前节点，并且将x的值设为null，便于GC回收（有兴趣的读者可以了解下JVM的垃圾回收机制）。

上面这段可能有点拗口，举个栗子，假如需要将LinkedList的菜单对象中的"叉烧包"移除：
在这里插入图片描述
那么需要将"小笼包"的next指针指向"奶黄包"，“奶黄包"的prev指针指向"小笼包”，并且将"叉烧包"的prev、item、next属性都设置为null。这样就可以完全移除"叉烧包"节点了。

remove(int index)

让我们再来看看依据索引来找到节点位置并移除节点的方法：

public E remove(int index) {
        checkElementIndex(index);
        return unlink(node(index));
    }

在remove(int index)方法中可以看到我们方法体中出现的方法都是上文我们提到过的，所以在此也不做赘述，简单说明下此方法的原理：先对形参索引index进行检查范围的判断之后，先通过node()方法获取在LinkedList中此索引位置的节点，然后再通过unlink()方法对此节点进行移除处理。

其实相比ArrayList，LinkedList在对节点增加、移除方面的性能要好一点，但是因为可能在寻找节点的过程中需要遍历链表才能找到所需节点，所以在获取元素方面，ArrayList还是略胜一筹。关于移除的方法，常用的还有removeFirst()、removeLast()等方法。

LinkedList遍历

在此主要对LinkedList的三种常用的遍历方式进行介绍：

普通for循环
增强for循环
Iterator迭代器

与此同时，还会通过对LinkedList的遍历来简单介绍这三种遍历方式的性能问题。

普通for循环

普通for循环就是简单地将LinkedList上的每个元素都遍历出来。

public static void listForNormal(LinkedList<Integer> list){
	// 记录开始时间
	long start = System.currentTimeMillis();
	int size = list.size();
	for(int i=0;i<size;i++){
		list.get(i);
	}
	//记录用时
	long interval = System.currentTimeMillis() - start;
	System.out.println("listForNormal："+interval+" ms");
}

增强for循环遍历LinkedList

所谓增强for循环遍历就是利用Java提供的语法糖，将LinkedList看成是数组，对LinkedList中的元素进行遍历。

public static void listByStrengThenFor(LinkedList<Integer> list){
    // 记录开始时间
    long start = System.currentTimeMillis();
    for (Integer i : list) { }
    // 记录用时
    long interval = System.currentTimeMillis() - start;
    System.out.println("listByStrengThenFor：" + interval + " ms");
}

迭代器遍历LinkedList

既使用集合类通用的Iterator类中的迭代器进行遍历，Iterator的实现是基于迭代器模式的。

public static void listByIterator(LinkedList<Integer> list){
	// 记录开始时间
	long start = System.currentTimeMillis();
	int size = list.size();
	for(Iterator iter = list.iterator(); iter.hasNext();){
		iter.next();
	}
	//记录用时
	long interval = System.currentTimeMillis() - start;
	System.out.println("listForNormal："+interval+" ms");
}

当我们依次调用这三种遍历方法后，其执行结果为：

listByNormalFor：1046 ms
listByStrengThenFor：6 ms
listByIterator：3 ms

可以看到，普通for循环的执行时间远大于普通遍历方式中使用get()方法来参与遍历过程，get()方法在上文中已经有介绍了，那么为什么增强for循环的执行时间跟迭代器遍历的执行时间相差不大呢？

我们将增强for循环LinkedList进行反编译：

private static void listByIterator(LinkedList<Integer> var0) {
    long var1 = System.currentTimeMillis();
    Iterator var3 = var0.iterator();
    while(var3.hasNext()) {
    	var3.next();
    }
    long var5 = System.currentTimeMillis() - var1;
    System.out.println("listByIterator:" + var5 + " ms");
}

可以看到，增强for循环的内部实现依然是通过Iterator迭代器来进行遍历的。

结语

可能会有看官觉得，了解ArrayList和LinkedList好像用处不大，不妨做下Leetcode的这道题，它会让你感受ArrayList和LinkedList的底层结构不同，带来的效果也会不一样：面试题62. 圆圈中最后剩下的数字。

如果本文对你的学习有帮助，请给一个赞吧，这会是我最大的动力~

参考资料：
Java集合 LinkedList的原理及使用

本文已授权发布在微信公众号：Java后端。

posted @ 2020-03-30 10:29 NYfor2018 阅读(407) 评论(0) 编辑收藏举报

刷新页面返回顶部

NYfor2018