java集合框架使用原理分析
集合是我们日常编程中可能用的很多的技术之一 使用频率极高 可能平时就会知道怎么去用 但是集合之间的关系与不同之处都不是很清楚 对它们的底层原理更甚 所以写词文章 让自己有一个更深的认识
集合是一个庞大的家族 今天先来说说这几个 ArrayList、LinkedList、Vector
ArrayList 由于它的底层是数组 数组我们都知道它的查询修改都是效率很高的 ArrayList也是如此 但是为什么查询修改效率高 插入和删除效率低较低呢 这就跟它的数据结构有关系呢 接下啦我们来看看ArrayList数据结构模型
插入、删除:如果我们要想集合中插入一个数100 它的操作步骤是 先在集合中把要插入的位置的数32复制一份 然后再把后面的数往后移 我们不仅要复制数据 而且还要将数据往后移 如果这个集合的数据很多的话 那效率就会很低 进行删除的话后面的数据复制一份 同时数据都要像前面移动 效率也很低
查询、修改: 修改如果进行查询 我们只需要通过数组下标就可以定位到数据 所以效率高 实际开发中 我们大部分是进行查询数据 所以ArrayList使用很广泛
任何事物都有两面性 不管是生活中 还是工作中 在编程也是同样适用的(因为编程也是人发明出来的嘛) 为了解决ArrayList的这一短板 聪明的程序员就使用另一个集合
ArrayList 增删改查的源码
从源码我们可以看出 不管是插入和删除元素的时候 ArrayList都会复制数组操作 这也就导致了它的效率不高
1 //查询元素
2 public E get(int index) {
3 //检查元素是否越界
4 rangeCheck(index);
5
6 return elementData(index);
7 }
8
9
10 //按顺序添加元素
11 public boolean add(E e) {
12 //确认开启扩容机制
13 ensureCapacityInternal(size + 1); // Increments modCount!!
14 elementData[size++] = e;
15 return true;
16 }
17
18 //在指定位置插入元素
19 public void add(int index, E element) {
20 //检查索引是否越界
21 rangeCheckForAdd(index);
22 //确认开启扩容机制
23 ensureCapacityInternal(size + 1); // Increments modCount!!
24 //复制数组
25 System.arraycopy(elementData, index, elementData, index + 1,
26 size - index);
27 //替换元素
28 elementData[index] = element;
29 size++;
30 }
31
32
33
34
35 //移除某个元素
36 public E remove(int index) {
37 rangeCheck(index);
38
39 modCount++;
40 E oldValue = elementData(index);
41
42 int numMoved = size - index - 1;
43 if (numMoved > 0)
//复制数组
44 System.arraycopy(elementData, index+1, elementData, index,
45 numMoved);
46 elementData[--size] = null; // clear to let GC do its work
47
48 return oldValue;
49 }
50
51
52
LinkedList
LinkedList它的底层是双向链表实现的非线程安全的集合,它是一个链表结构,不能像数组一样随机访问,必须是每个元素依次遍历直到找到元素为止。其结构的特殊性导致它查询数据慢。 接下来我们来看看它的结构模型
插入、删除 :因为是链表结构 所以它的插入效率很高 (如果在14 和 18之间插入一个33 的话,链表直接会将连接到18的链子断开 然后连接上33所在的前节点 数据18的前节点再连接上33的后节点 如图2所示) 也就是说 插入一个数字我们只需要将(14 和 18 之间的)链表断开 再将14和33之间的链表连上即可 比ArrayList的数组复制效率高
查询、修改 :LinkedList 查询速度慢 因为它要遍历整个整个集合 直到找到元素为止 如果集合数组多的话 消耗的资源就多 而ArrayList是通过数组下标定位速度快 同样他也是线程不安全的
linkedList
在执行查询时 先判断元素是靠近头部还是尾部 如果是头部 若靠近头部,则从头部开始依次查询判断
执行插入时 判断是插入到中间还是尾部 如果插入到尾部 直接将尾节点的下一个指针指向新增节点。如果插入到中间 获取到当前节点的上一个节点(D) 并将D节点的后指针指向新的节点头指针 然后新增节点的下一个指针指向当前节点。
1 //查询元素
2 public E get(int index) {
3 //检查所引是否越界
4 checkElementIndex(index);
5 return node(index).item;
6 }
7
8 // 返回指定索引处的节点
9 Node<E> node(int index) {
10 // 指定的索引值与链表大小右移一位,及除以 2 进行比较
11 if (index < (size >> 1)) { // 索引小,则从首节点向后扫描,直到索引值处
12 Node<E> x = first;
13 for (int i = 0; i < index; i++)
14 x = x.next;
15 return x;
16 } else { // 索引大,则从尾节点向前扫描,直到索引值处
17 Node<E> x = last;
18 for (int i = size - 1; i > index; i--)
19 x = x.prev;
20 return x;
21 }
22 }
23
24
25 //移除指定元素
26 public E remove(int index) {
27 checkElementIndex(index);
28 return unlink(node(index));
29 }
30
31 //在指定位置添加元素
32 public void add(int index, E element) {
33 //检查所引是否越界
34 checkPositionIndex(index);
35 // 在链表末尾天添加
36 if (index == size)
37 linkLast(element);
38 else
39 linkBefore(element, node(index));
40 }
41
42 private static class Node<E> {
43 E item;
44 //头节点
45 Node<E> next;
46 //尾节点
47 Node<E> prev;
48 Node(Node<E> prev, E element, Node<E> next) {
49 this.item = element;
50 this.next = next;
51 this.prev = prev;
52 }
53 }
54
55 /**
56 * Links e as last element.
57 */
58 void linkLast(E e) {
59 //用l来临时保存未插入前的last节点
60 final Node<E> l = last;
61 //创建一个值为e的新节点 添加第一个元素时 l = null
62 final Node<E> newNode = new Node<>(l, e, null);
63 //将新节点赋值的last
64 last = newNode;
65 if (l == null)
66 first = newNode;
67 else
68 l.next = newNode;
69 size++;
70 modCount++;
71 }
Vector
Vector的数据结构和使用方法 跟ArrayList相同 不同之处在于Vector是线程安全的 几乎所有的对数据操作的方法都被synchronized关键字修饰 synchronized是线程同步的 当一个线程获得Vector对象锁的时候 其它的线程必须等到它执行完毕之后(锁被释放)才能执行
总结
1.ArrayList 它的底层是一个数组 查询修改数据快(通过下标定位) 但是插入删除数据比较慢 (插入数据慢是因为复制数组耗时) 为了改进这个缺点 于是就有了LinkedList数组 它是一个链表结构 插入和删除数据很快(只需要修改指针引用) 但是查询和修改数效率低(他要查询到整个链表从第一个开始寻找 一直找到为止)
2.ArrayList 和LinkedList都是线程不安全的
3.Vector是线程安全的 但是效率低 当我们执行单个线程的时候ArrayList的效率高于Vector