Java源码系统之ArrayList

Java源码系列之ArrayList

一、介绍

java.util.ArrayList<E> 是非常重要的一个类，在代码中广泛使用，E表示泛型，ArrayList是一个泛型类。

ArrayList相当于C++ 的vector，用于存储对象。与数组不同，数组一旦创建，长度固定，但是ArrayList的长度是动态的，不受限制，可以存储任意多的对象，但是只能存储对象，不能存储原生数据类型例如int。它的继承类图关系如下：

从图上可以看出，ArrayList继承了AbstractList，实现了List、Cloneable、Serializable、RandomAccess接口。

二、源码分析

基本属性

 /**
      * 默认初始容量，大小为10.
      */
     private static final int DEFAULT_CAPACITY = 10;
 
     /**
      * 空的数组，传入容量为0时使用.
      */
     private static final Object[] EMPTY_ELEMENTDATA = {};
 
     /**
      * 空的数组，传入容量时使用，当容器添加第一个元素时，会进行扩容，具体见add(E e)方法.
      */
     private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
 
     /**
      * 真正存储元素的数组
      */
     transient Object[] elementData; // non-private to simplify nested class access
     
     /**
     * 要分配的数组的最大值
     */
     private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

DEFAULT_CAPACITY ：默认容量为10，也就是通过new ArrayList()创建时的默认容量。
EMPTY_ELEMENTDATA ：空的数组，这种是通过new ArrayList(0)创建时用的是这个空数组。
DEFAULTCAPACITY_EMPTY_ELEMENTDATA：也是空数组，这种是通过new ArrayList()创建时用的是这个空数组，与EMPTY_ELEMENTDATA的区别是在添加第一个元素时使用这个空数组的会初始化为DEFAULT_CAPACITY（10）个元素。
elementData：真正存放元素的地方，使用transient是为了不序列化这个字段。
size：真正存储元素的个数，而不是elementData数组的长度。
MAX_ARRAY_SIZE：数组长度的最大值是Integer.MAX_VALUE - 8

数组作为一个对象，需要一定的内存存储对象头信息，对象头信息最大占用内存不可超过8字节。

如果数组长度过大，可能出现的两种错误

OutOfMemoryError: Java heap space 堆区内存不足（这个可以通过设置JVM参数 -Xmx 来指定）。

OutOfMemoryError: Requested array size exceeds VM limit 超过了JVM虚拟机的最大限制，我的window64就是 Integer.MAX_VALUE-1 .

构造方法之ArrayList(int initialCapacity)

     public ArrayList(int initialCapacity) {
         if (initialCapacity > 0) {
             //如果传入的初始容量值大于0，则初始化一个初始容量大小的数组，用来存储元素
             this.elementData = new Object[initialCapacity];
         } else if (initialCapacity == 0) {
             //如果等于0，则把空数组EMPTY_ELEMENTDATA赋给elementData
             this.elementData = EMPTY_ELEMENTDATA;
         } else {
             //如果小于0，则抛出异常
             throw new IllegalArgumentException("Illegal Capacity: "+
                                                initialCapacity);
         }
     }

构造方法之ArrayList()

     public ArrayList() {
         //使用空数组DEFAULTCAPACITY_EMPTY_ELEMENTDATA，在添加第一个元素的时候会扩容
         this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
     }

构造方法之ArrayList(Collection<? extends E> c)

     public ArrayList(Collection<? extends E> c) {
         //传入的集合转为数组，并赋值给elementData
         elementData = c.toArray();
         //判断传入的集合的大小是否为0
         if ((size = elementData.length) != 0) {
             //判断集合toArray()返回的结果是否是Object[].class,如果不是，则重新拷贝成Object[].class类型
             if (elementData.getClass() != Object[].class)
                 elementData = Arrays.copyOf(elementData, size, Object[].class);
         } else {
             //如果传入的集合为0，则初始化为空数组EMPTY_ELEMENTDATA
             this.elementData = EMPTY_ELEMENTDATA;
         }
     }

方法之add(E e)

     /**
     * 添加元素
     */
     public boolean add(E e) {
         //检查是否需要扩容
         ensureCapacityInternal(size + 1);  // Increments modCount!!
         //添加元素到最后一位
         elementData[size++] = e;
         return true;
     }
 
     private void ensureCapacityInternal(int minCapacity) {
         if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
             //如果elementData为空数组，则取默认容量和传入的所需最小容量(minCapacity)之中大的值
             //并把该值重新赋值给minCapacity
             minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
         }
 
         ensureExplicitCapacity(minCapacity);
     }
 
     private void ensureExplicitCapacity(int minCapacity) {
         modCount++;
 
         // overflow-conscious code
         if (minCapacity - elementData.length > 0)
             //真正的扩容方法
             grow(minCapacity);
     }
 
     private void grow(int minCapacity) {
         // overflow-conscious code
         int oldCapacity = elementData.length;
         //新的容量是老容量1.5倍
         int newCapacity = oldCapacity + (oldCapacity >> 1);
         if (newCapacity - minCapacity < 0)
             //如果新容量比所需最小容量小，则把所需最小容量值赋给新的容量
             newCapacity = minCapacity;
         if (newCapacity - MAX_ARRAY_SIZE > 0)
             //如果新容量要大于所允许的最大长度，则会使用最大容量为Integer的最大值，
             //否则使用MAX_ARRAY_SIZE
             newCapacity = hugeCapacity(minCapacity);
         //以新容量拷贝出来一个新数组
         elementData = Arrays.copyOf(elementData, newCapacity);
     }
 
     private static int hugeCapacity(int minCapacity) {
         if (minCapacity < 0) // overflow
             throw new OutOfMemoryError();
         return (minCapacity > MAX_ARRAY_SIZE) ?
             Integer.MAX_VALUE :
             MAX_ARRAY_SIZE;
     }

方法之add(int index, E element)

     /**
     * 添加元素到指定位置
     */
     public void add(int index, E element) {
         //检查是否越界
         rangeCheckForAdd(index);
         //检查是否需要扩容
         ensureCapacityInternal(size + 1);  // Increments modCount!!
         //将下标为index及之后的元素向后移一位，这样index就空出来了
         System.arraycopy(elementData, index, elementData, index + 1,
                          size - index);
         //将元素插入到index的位置
         elementData[index] = element;
         //大小加1
         size++;
     }
 
     private void rangeCheckForAdd(int index) {
         if (index > size || index < 0)
             throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
     }

方法之addAll(Collection<? extends E> c)

     /**
     * 求两个集合的并集
     */
     public boolean addAll(Collection<? extends E> c) {
         //将集合c转为数组
         Object[] a = c.toArray();
         //集合a的大小
         int numNew = a.length;
         //扩容所需的容量=已有数组的大小+c集合的大小
         ensureCapacityInternal(size + numNew);  // Increments modCount
         //将集合c的元素，拷贝到数组的最后
         System.arraycopy(a, 0, elementData, size, numNew);
         //size加上c集合的大小
         size += numNew;
         //如果集合c不为空，返回true，否则返回false
         return numNew != 0;
     }

方法之get(int index)

     /**
     * 获取指定位置的元素
     */
     public E get(int index) {
         //检查是否越界
         rangeCheck(index);
         //返回数组index的元素
         return elementData(index);
     }
 
     private void rangeCheck(int index) {
         if (index >= size)
             throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
     }
     
     E elementData(int index) {
         return (E) elementData[index];
     }

注：获取指定索引位置的元素，时间复杂度为O(1)。

方法之remove(int index)

     /**
     * 删除指定位置元素
     */
     public E remove(int index) {
         //检查是否越界
         rangeCheck(index);
 
         modCount++;
         //获取index位置的元素
         E oldValue = elementData(index);
 
         int numMoved = size - index - 1;
         //如果index不是最后一位，则将index之后的元素往前挪一位
         if (numMoved > 0)
             System.arraycopy(elementData, index+1, elementData, index,numMoved);
         //讲最后一个元素删除，置空，帮助GC回收
         elementData[--size] = null; // clear to let GC do its work
         //返回旧值，即删除的index对应的值
         return oldValue;
     }

注：删除指定索引位置的元素，时间复杂度为O(n)；而且从源码上可以看出，删除元素后ArrayList并没有缩容。

方法之remove(Object o)

     /**
     * 删除指定元素值的元素
     */
     public boolean remove(Object o) {
         if (o == null) {
             //遍历整个数组，找到元素第一次出现的位置，并将其快速删除
             for (int index = 0; index < size; index++)
                 //如果要删除的元素为null，则使用==进行比较，满足条件则进行快速删除，并返回true
                 if (elementData[index] == null) {
                     fastRemove(index);
                     return true;
                 }
         } else {
             //遍历整个数组，找到元素第一次出现的位置，并将其快速删除
             for (int index = 0; index < size; index++)
                 //如果要删除的元素不为null，则使用equals进行比较，满足条件则进行快速删除，并返回true
                 if (o.equals(elementData[index])) {
                     fastRemove(index);
                     return true;
                 }
         }
         return false;
     }
 
     /*
      * Private remove method that skips bounds checking and does not
      * return the value removed.
      */
     private void fastRemove(int index) {
         //和remove(int index)方法少了检查越界的方法
         //这样可以提高性能
         modCount++;
         int numMoved = size - index - 1;
         if (numMoved > 0)
             System.arraycopy(elementData, index+1, elementData, index,
                              numMoved);
         elementData[--size] = null; // clear to let GC do its work
     }

方法之retainAll(Collection<?> c)

     /**
     * 求两个集合的交集
     */
     public boolean retainAll(Collection<?> c) {
         //校验集合c是否为null，为null则抛出NullPointerException
         Objects.requireNonNull(c);
         //调用批量删除方法，这时complement传入true，表示删除不包含在c中的元素
         return batchRemove(c, true);
     }
 
     /**
      * 批量删除
      * @param c 集合
      * @param complement 为true，表示删除不包含在c中的元素，否则表示删除包含c中的元素
      * @return
      */
     private boolean batchRemove(Collection<?> c, boolean complement) {
         final Object[] elementData = this.elementData;
         //使用读写两个指针同时遍历数组
         //读指针每次自增1，写指针放入元素的时候才加1
         //这样不需要额外的空间，只需要在原有的数组上操作就可以了
         int r = 0, w = 0;
         boolean modified = false;
         try {
             //遍历整个数组，如果c中包含该元素，则把该元素放到写指针的位置（以complement为准）
             for (; r < size; r++)
                 if (c.contains(elementData[r]) == complement)
                     elementData[w++] = elementData[r];
         } finally {
             // Preserve behavioral compatibility with AbstractCollection,
             // even if c.contains() throws.
             //正常来说r最后是等于size的，除非c.contains()抛出了异常
             if (r != size) {
                 //如果c.contains()抛出了异常，则把未读的元素都拷贝到写指针之后
                 System.arraycopy(elementData, r,
                                  elementData, w,
                                  size - r);
                 w += size - r;
             }
             if (w != size) {
                 //将写指针之后的元素置为空，帮助GC回收
                 for (int i = w; i < size; i++)
                     elementData[i] = null;
                 modCount += size - w;
                 //新的大小等于写指针的位置，因为每写一次写指针就加1，所以新大小正好等于写指针的位置
                 size = w;
                 //有修改，设置modified=true
                 modified = true;
             }
         }
         return modified;
     }

方法之removeAll(Collection<?> c)

     /**
     * 删除包含c集合的元素，即求差集
     */
     public boolean removeAll(Collection<?> c) {
         //检查集合c不能为null
         Objects.requireNonNull(c);
         //批量删除，complement为false，表示删除包含在c中的元素
         return batchRemove(c, false);
     }

elementData之序列化

 private void writeObject(java.io.ObjectOutputStream s)
         throws java.io.IOException{
     //防止序列化期间有修改
     int expectedModCount = modCount;
     //写出非transient非static属性（会写出size属性）
     s.defaultWriteObject();
 
     //写出元素个数
     s.writeInt(size);
 
     //依次写出元素
     for (int i=0; i<size; i++) {
         s.writeObject(elementData[i]);
     }
 
     //如果有修改，抛出异常
     if (modCount != expectedModCount) {
         throw new ConcurrentModificationException();
     }
 }
 
 private void readObject(java.io.ObjectInputStream s)
         throws java.io.IOException, ClassNotFoundException {
     //声明为空数组
     elementData = EMPTY_ELEMENTDATA;
 
     //读入非transient非static属性（会读取size属性）
     s.defaultReadObject();
 
     //读入元素个数，没什么用，只是因为写出的时候写了size属性，读的时候也要按顺序来读
     s.readInt();
 
     if (size > 0) {
         //计算容量
         int capacity = calculateCapacity(elementData, size);
         SharedSecrets.getJavaOISAccess().checkArray(s, Object[].class, capacity);
         //检查是否需要扩容
         ensureCapacityInternal(size);
 
         Object[] a = elementData;
         //依次读取元素到数组中
         for (int i=0; i<size; i++) {
             a[i] = s.readObject();
         }
     }
 }

注：

查看writeObject()方法可知，先调用s.defaultWriteObject()方法，再把size写入到流中，再把元素一个一个的写入到流中。

一般地，只要实现了Serializable接口即可自动序列化，writeObject()和readObject()是为了自己控制序列化的方式，这两个方法必须声明为private，在java.io.ObjectStreamClass#getPrivateMethod()方法中通过反射获取到writeObject()这个方法。

在ArrayList的writeObject()方法中先调用了s.defaultWriteObject()方法，这个方法是写入非static非transient的属性，在ArrayList中也就是size属性。同样地，在readObject()方法中先调用了s.defaultReadObject()方法解析出了size属性。

elementData定义为transient的优势，自己根据size序列化真实的元素，而不是根据数组的长度序列化元素，减少了空间占用。

总结

ArrayList内部使用数组存储元素，当数组长度不够时进行扩容，每次加一半的空间，ArrayList不会进行缩容；
ArrayList支持随机访问，通过索引访问元素极快，时间复杂度为O(1)；
ArrayList添加元素到尾部极快，平均时间复杂度为O(1)；
ArrayList添加元素到中间比较慢，因为要搬移元素，平均时间复杂度为O(n)；
ArrayList从尾部删除元素极快，时间复杂度为O(1)；
ArrayList从中间删除元素比较慢，因为要搬移元素，平均时间复杂度为O(n)；
ArrayList支持求并集，调用addAll(Collection<? extends E> c)方法即可；
ArrayList支持求交集，调用retainAll(Collection<? extends E> c)方法即可；
ArrayList支持求单向差集，调用removeAll(Collection<? extends E> c)方法即可；

posted on 2019-07-17 10:56 完美零度阅读(113) 评论(0) 编辑收藏举报

刷新页面返回顶部

完美零度