Java集合:ArrayList (JDK1.8 源码解读)

ArrayList

ArrayList几乎是每个java开发者最常用也是最熟悉的集合,看到ArrayList这个名字就知道,它必然是以数组方式实现的集合

 

关注点

说一下ArrayList的几个特点,也是面试喜欢问的几个点:

1.是否允许为空:是

2.是否允许重复数据:是

3.是否有序:是

4.是否线程安全:否

 

主要声明

看一下ArrayList的声明:

public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable

ArrayList继承自AbstractList,并且实现了List接口(还实现了RandomAccess、Cloneable、Serializable),List接口又继承自顶层集合接口Cellection,实现了List接口就代表它是一个有序的集合

 

再看一下ArrayList声明的主要变量:

// 默认容量
private static final int DEFAULT_CAPACITY = 10;

// 一个空的数组
private static final Object[] EMPTY_ELEMENTDATA = {};

// 默认容量的空数组,搞这么多空数组干嘛?|_・)
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};

// ArrayList的核心,elemenData就是底层的数组
transient Object[] elementData;

// 数组所包含的元素数量
private int size;

这里做一下几个主要变量的说明:

1.DEFAULT_CAPACITY 并不是ArrayList的初始大小,只是默认大小

2.EMPTY_ELEMENTDATA和DEFAULTCAPACITY_EMPTY_ELEMENTDATA 就是两个空的对象数组,后面会在构造方法里面用到

3.ArrayList是基于数组的一个实现,elementData就是底层的数组

4.size数组所包含的元素的数量,ArrayList的size()方法返回的就是这个size的值

 

看完这些,我们来写个例子实际操作一下:

public static void main(String[] args)
{
    List<String> list = new ArrayList<>();
    //List<String> list = new ArrayList<>(10);
    list.add("111"); 
    list.add("222"); 
}

构造方法

1.无参构造器

public ArrayList() {
  this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;// this(10)  jdk1.6写法
}

直接把声明的空数组丢给elementData,也就是说ArrayList在jdk1.8中初始化的时候大小是0,并不是10,这和jdk1.6有区别

 

2.带初始化容量大小的构造器,上面例子中注释掉的代码的用法

public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[];
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }

传递一个int类型的参数initialCapacity作为ArrayList的初始化大小,如果initialCapacity大于0,则声明一个initialCapacity大小的对象数组给elementData赋值,如果initialCapacity为0就把声明的空对象数组给elementData,如果小于0你懂的

 

3. 还有一种构造器例子中未展示的 public ArrayList(Collection<? extends E> c) 传一个集合进去,也比较简单就是把集合转成数组赋值给elementData

 

添加元素

照着例子继续往下看,添加元素的时候,ArrayList会做什么,看看add的源码:

 1 public boolean add(E e) {
 2     ensureCapacityInternal(size + 1); 
 3     elementData[size++] = e;
 4     return true;
 5 }   
 6 
 7 private void ensureCapacityInternal(int minCapacity) {
 8      if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
 9          minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
10      }
11      ensureExplicitCapacity(minCapacity);
12 }
13 
14 private void ensureExplicitCapacity(int minCapacity) {
15      modCount++;
16      if (minCapacity - elementData.length > 0)
17          grow(minCapacity);
18 } 

第二行代码是扩容用的我们先不管,直接看第三行,第三行告诉我们再调用add方法往集合里面添加元素的时候只是给对象数组加了一个元素而已,画图来说明一下

扩容

new ArrayList()的时候构造方法只给了一个DEFAULTCAPACITY_EMPTY_ELEMENTDATA声明的空对象数组,为什么例子的add方法的第三行还能执行往elementData里面添加元素,那么扩容就出现了

看第七行的ensureCapacityInternal(int minCapacity)方法(注:size表示数组内元素个数,那么我要往数组添加一个元素,minCapacity就是数组执行添加时最小需要的容量),执行add("111"),ArrayList的size初始值为0,那么minCapacity的值就为1,看第8行此时elementData是不是就是那个空的对象数组DEFAULTCAPACITY_EMPTY_ELEMENTDATA,

继续往下,把minCapacity赋值为minCapacity和默认容量两者的最大值,minCapacity的值就成了10,然后minCapacity最小容量和数组长度去比较,数组的长度已经不能满足添加元素后的最小容量,数组就会去执行扩容的grow(minCapacity)方法进行数组扩容,所以ArrayList触发扩容的条件就是数组长度不够了或者说数组已经装满了看一下grow方法具体:

1 private void grow(int minCapacity) {
2      int oldCapacity = elementData.length;
3      int newCapacity = oldCapacity + (oldCapacity >> 1);
4      if (newCapacity - minCapacity < 0)
5          newCapacity = minCapacity;
6      if (newCapacity - MAX_ARRAY_SIZE > 0)
7          newCapacity = hugeCapacity(minCapacity);
8      elementData = Arrays.copyOf(elementData, newCapacity);
9 }

简单的说一下,第三行:新的数组长度=原数组长度 + 原数组长度的一半,这里使用的位运算>>1 ,oldCapacity是偶数就是一半,基数就是(oldCapacity-1)/2,因为长度必须得是整数,jdk1.6中使用的是 newCapacity = (oldCapacity * 3)/2 + 1,所以当别人问你ArrayList每次扩容多少时,你可以说扩容了二分之一的大小

问题:至于为什么要扩容二分之一?

可以看第八行代码,当确定了新数组长度之后,会把旧的elementData复制到一个新的长度为newCapacity的数组中去然后赋值给原来的elementData数组,如图

 

1.如果扩容的太少,则必须频繁的进行扩容操作,频繁的复制数组这必然会降低效率

2.如果扩容的太多,数组内就会有很多空闲的位置,就会造成空间上的浪费

所以JDK的开发人员必定是经过考量和权衡才会决定扩容的大小

 

插入元素

ArrayList在进行插入操作的时候也是使用的add方法,举个例子:

1     List<String> list = new ArrayList<>();
2     list.add("11"); 
3     list.add("33"); 
4     list.add("44");
5     list.add("55");
6     list.add(2,"22");//插入元素

第六行便是往ArrayList里面插入元素,看一下list.add(2,"22")执行的操作:

1 public void add(int index, E element) {
2     rangeCheckForAdd(index);
3 
4     ensureCapacityInternal(size + 1); 
5     System.arraycopy(elementData, index, elementData, index + 1,size - index);
7     elementData[index] = element;
8     size++;
9 }

先检查插入的下标是否小于0或者大于数组内元素的个数,如果不在这个范围内抛出数组下标越界IndexOutOfBoundsException

判断下标合法性之后和添加元素一样判断是否需要扩容,然后按照下标指定的位置,把elementData数组内从指定位置开始的所有元素利用System.arraycopy方法做一个整体复制,向后移动一个位置,并且为指定下标位置插入对应的元素,画图表示一下这个过程:

删除元素

 ArrayList提供了两种删除元素的方法:

1.通过指定下标删除

2.通过指定元素删除

先看第一种:

 1 public E remove(int index) {
 2     rangeCheck(index);
 3 
 4     modCount++;
 5     E oldValue = elementData(index);
 6 
 7     int numMoved = size - index - 1;
 8     if (numMoved > 0)
 9         System.arraycopy(elementData, index+1, elementData, index,
10                              numMoved);
11     elementData[--size] = null; // clear to let GC do its work
12 
13     return oldValue;
14}

同样的先检查指定下标的合法性,是否在可删除范围内,记录要删除的元素,return的时候返回删除的元素,然后获取需要复制的数组长度,除非你指定删除的位置就是数组的最后一个元素,否则就是同样的套路,复制指定下标+1位置开始的元素,向前移动一个位置,并且给数组元素最后一个元素赋值null,让GC来回收它,来个图表示一下:

再来看第二种按照元素删除:

 1 public boolean remove(Object o) {
 2         if (o == null) {
 3             for (int index = 0; index < size; index++)
 4                 if (elementData[index] == null) {
 5                     fastRemove(index);
 6                     return true;
 7                 }
 8         } else {
 9             for (int index = 0; index < size; index++)
10                 if (o.equals(elementData[index])) {
11                     fastRemove(index);
12                     return true;
13                 }
14         }
15      return false;
16 }

遍历数组寻找匹配的元素,只不过元素为null的时候使用的==判断其他类型都使用equals方法判断,如果匹配了就执行fastRemove,fastRemove干了啥呢?

1 private void fastRemove(int index) {
2         modCount++;
3         int numMoved = size - index - 1;
4         if (numMoved > 0)
5             System.arraycopy(elementData, index+1, elementData, index,
6                              numMoved);
7         elementData[--size] = null; // clear to let GC do its work
8     }

这不就是按照下标删除的操作吗?所以这两种删除方式的差别就是第一种返回被删除的元素,第二种删除匹配元素返回true,没有匹配元素返回false

到这里ArrayList的基本操作就讲完了,总结一下:

ArrayList的优点:

1.ArrayList层是数组实现的,支持随机访问,并且实现了RandomAccess接口,所以查找数据非常快

2.顺序添加非常快,只是往数组尾部添加了一个元素

3.从尾部删除也非常方便,只是把最后一个元素变成了null,等待GC回收

ArrayList的缺点:

1.如果从中间插入元素或者删除元素会涉及到数组元素的复制,如果复制的元素太多非常耗费性能

2.ArrayList的底层数组是个动态数组,大小会随着元素的增加而进行扩容,扩容涉及到数组元素的复制,会消耗性能和空间,所以如果在使用ArrayList的时候能确定或者大概知道数据量大小,在new ArrayList的时候请一个合理的初始化大小,避免频繁扩容

总的来说ArrayList适合顺序添加,随机访问的使用场景

 

ArrayList和Vector的区别

 ArrayList里面的方法都不是线程同步的,所以ArrayList的线程是不安全的,在多线程情况下会有线程安全问题,可以使用Collections.synchronizedList方法把你的ArrayList变成一个线程安全的List

List<String> synchronizedList = Collections.synchronizedList(list);

还有一种方法就是使用Vector,Vector和ArrayList的实现方式几乎一样,只不过Vector的大部分public方法都是加了synchronized,ArrayList和Vector主要有两个区别:

1.Vector线程安全

2.Vector可以指定增长因子,扩容的时候原数组会增加增长因子个大小,如果增长因子缺省那么就会增加一倍的大小

int newCapacity = oldCapacity + ((capacityIncrement > 0) ? capacityIncrement : oldCapacity);

 

posted on 2019-08-29 11:37  全村的希望QAQ  阅读(348)  评论(0编辑  收藏  举报

导航