JDK源码分析(4)之 LinkedList 相关
LinkedList
的源码大致分三个部分,双向循环链表的实现、List的API和Deque的API。
一、定义
public class LinkedList<E>
extends AbstractSequentialList<E>
implements List<E>, Deque<E>, Cloneable, java.io.Serializable
从类定义和图中也能很清晰的看到,LinkedList
的结构大致分为三个部分;同时和ArrayList
相比,他并没有实现RandomAccess
接口,所以他并不支持随机访问操作;另外可以看到他的List
接口是通过AbstractSequentialList
实现的,同时还实现了多个迭代器,表明他的访问操作时通过迭代器完成的。
二、链表结构
常见链表
LinkedList
是基于双向循环链表实现的,所以如图所示,当对链表进行插入、删除等操作时,
- 首先需要区分操作节点是否为首尾节点,并区分是否为空,
- 然后再变更相应
pre
和next
的引用即可;
void linkFirst(E e)
void linkLast(E e)
void linkBefore(E e, Node<E> succ)
E unlinkFirst(Node<E> f)
E unlinkLast(Node<E> l)
E unlink(Node<E> x)
/**
* Returns the (non-null) Node at the specified element index.
*/
Node<E> node(int index) {
// assert isElementIndex(index);
if (index < (size >> 1)) {
Node<E> x = first;
for (int i = 0; i < index; i++)
x = x.next;
return x;
} else {
Node<E> x = last;
for (int i = size - 1; i > index; i--)
x = x.prev;
return x;
}
}
上面所列的方法封装了对双向循环链表常用操作,其中node(int index)
是随机查询方法,这里通过判断index
是前半段还是后半段,来确定遍历的方向以增加效率。
同时在LinkedList
中有关List
和Deque
的API也是基于上面的封装的方法完成的。具体代码比较简单,就不挨着分析了。
三、序列化和反序列化
transient int size = 0;
transient Node<E> first;
transient Node<E> last;
可以看到LinkedList
的成员变量都是用transient
修饰的,那么在序列化的时候,他是怎么将包含的dada序列化的呢?
private void writeObject(java.io.ObjectOutputStream s) throws java.io.IOException {
// Write out any hidden serialization magic
s.defaultWriteObject();
// Write out size
s.writeInt(size);
// Write out all elements in the proper order.
for (Node<E> x = first; x != null; x = x.next)
s.writeObject(x.item);
}
private void readObject(java.io.ObjectInputStream s) throws java.io.IOException, ClassNotFoundException {
// Read in any hidden serialization magic
s.defaultReadObject();
// Read in size
int size = s.readInt();
// Read in all elements in the proper order.
for (int i = 0; i < size; i++)
linkLast((E)s.readObject());
}
可以看到序列化的时候是将size
和node
中的data提取出来,放入java.io.ObjectInputStream
,这样就避免了很多结构性的数据传输。
四、遍历
关于LinkedList
的遍历这里有一个经常都会踩的坑需要注意一下。
- 随机访问
for (int i=0, len = list.size(); i < len; i++) {
String s = list.get(i);
}
- 迭代器遍历
Iterator iter = list.iterator();
while (iter.hasNext()) {
String s = (String)iter.next();
}
- 增强for循环遍历
for (String s : list) {
...
}
- 效率测试
对一个LinkedList
做顺序遍历:
1000 | 10000 | 100000 | 200000 | |
---|---|---|---|---|
随机访问 | 2 | 101 | 13805 | 105930 |
增强for循环 | 1 | 1 | 3 | 3 |
迭代器 | 1 | 1 | 3 | 3 |
这里可以明显的看增强for循环和迭代器的效率差不多,这是因为增强for循环也是通过迭代器实现的,具体可以查看我在ArrayList
章节的分析;但是随机访问的方式遍历,耗时在急剧增加,这是为什么呢?
public E get(int index) {
checkElementIndex(index);
return node(index).item;
}
这里可以看到get(int index)
是使用node(int index)
实现的,所以对于迭代器和增强for循环遍历时间复杂度是O(n)
,而使用随机访问的方式遍历时间复杂度则是O(n*n)
;所以在对LinkedList
遍历的时候一定不能采用随机访问的方式。建议直接使用增强for循环遍历,如果一定要使用随机访问则需要判断是否实现RandomAccess
接口。
五、插入和删除
网上一般都在说LinkedList
比ArrayList
的插入和删除快,因为ArryList
基于数组,需要移动后续元素,而LinkedList
则只需要修改两条引用;但是实际如何呢?
private static final Random RANDOM = new Random();
private static List<String> getList(List<String> list, int n) {
for (int i = 0; i < n; i++) {
list.add("a" + i);
}
return list;
}
private static long test(List<String> list, int count) {
long start = System.currentTimeMillis();
for (int i = 0; i < count; i++) {
list.add(RANDOM.nextInt(list.size()), i + "");
list.remove(RANDOM.nextInt(list.size()));
}
return System.currentTimeMillis() - start;
}
public static void main(String[] args) {
int[] tt = {1000, 10000, 50000};
for (int t : tt) {
List<String> linked = getList(new LinkedList<>(), t);
List<String> array = getList(new ArrayList<>(), t);
System.out.println("------------" + t);
System.out.println("--linked: " + test(linked, t));
System.out.println("--array:" + test(array, t));
}
}
这里只是简单测试一下,如果需要精确结果可以使用JMH
基准测试,
这里是对长度为 n 的 List,进行随机插入和删除 n 次,结果如下:
1000 | 10000 | 50000 | |
---|---|---|---|
LinkedList | 6 | 502 | 18379 |
ArrayList | 2 | 9 | 202 |
如果只是在 List 的首尾插入和删除呢,测试结果如下:
1000 | 10000 | 50000 | |
---|---|---|---|
LinkedList | 1 | 4 | 9 |
ArrayList | 2 | 11 | 200 |
根据测试结果:
-
对于随机插入和删除,
LinkedList
效率低于ArrayList
;主要是因为LinkedList
遍历定位的时候比较慢,而ArrayList
是基于数组,可以通过偏移量直接定位,并且ArrayList
在插入和删除时,移动数组是通过System.arraycopy
完成的,jvm 有做特殊优化,效率比较高。 -
对于首尾的插入和删除,
LinkedList
效率高于ArrayList
,这里因为LinkedList
只需要插入删除一个节点就可以,但ArrayList
需要移动数组,同时可能还需要扩容操作,所以比较慢。
总结
- LinkedList 基于双向循环链表实现,随机访问比较慢,所以在遍历 List 的时候一定要注意。
- LinkedList 可以添加重复元素,可以添加 null。