Collectoions集合学习笔记(一)-ArrayList源码学习

一、ArrayList

1.1 ArrayList简介

ArrayList是可以动态增长和缩减的索引序列,其实现了List接口,List接口又继承了Collection接口。它的底层是由数组实现的,数组元素类型为Object类型,即可以存放所有类型数据。

我们对ArrayList类的实例的所有的操作底层都是基于数组的。

1.2 继承关系

1.3 几点小结

学习的本质是理解,本想写一个全面详细的文档,但一想那和字典有什么区别呢?方法不会可以直接去查,但是原理便需要去理解,于是这里记录一下自己阅读源码过程中遇到的一些有意思的小点,并结合源码和其他资料来回答自己的问题。

1.ArrayList类中有哪些成员变量和属性?

 1     /**
 2      * 默认初始容量为10
 3      */
 4     private static final int DEFAULT_CAPACITY = 10;
 5     /**
 6      * 一个空对象数组
 7      */
 8     private static final Object[] EMPTY_ELEMENTDATA = {};
 9     */默认的空对象数组
10     private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
11      */元素数组
12     transient Object[] elementData; // non-private to simplify nested class access
13      */实际元素大小, 默认为0
14     private int size;
15      */最大数组容量
16     private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

 看到这里,我有两个问题:

(1)这里的空对象数组和默认空对象数组有什么区别,为啥要搞两个空数组?

   答:通过阅读后面的构造方法源码,可以清晰的看出

   private static final Object[] EMPTY_ELEMENTDATA = {}; 

   空对象数组用于有参数的构造方法, 该方法构造一个具有指定初始容量的空数组,当输入的指定初始容量为0时,便返回一个这样的空对象数组

   private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {}; 

  默认的空对象数组用于无参数的构造方法,调用这个方法,便返回一个初始容量为10的默认空对象数组

(2)最大数组容量为什么是 MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8; ?

 答:数组需要8 bytes去存储它自己的大小(2,147,483,648)(2^31),另外在源码注释里也写了

  一些虚拟机会在数组中保留一些标题字。尝试分配较大的数组可能会导致OutOfMemory错误:即请求的数组大小超过了虚拟机限制

2.ArrayList是怎样创建的?

源码中共提供了三种构造方法:

 

 (1)无参构造方法:

    /**
     * Constructs an empty list with an initial capacity of ten.
     */
    public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }

(2)指定容量的有参构造方法:

    /**
     * 构造一个具有指定初始容量的空列表
     *
     * @param  initialCapacity  列表的初始容量
     * @throws IllegalArgumentException  若传入的初始容量为负抛出此异常
     *         
     */
    public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }

(3)构造一个包含指定 collection 的元素的列表

    /**
     * Constructs a list containing the elements of the specified
     * collection, in the order they are returned by the collection's
     * iterator.
     *
     * @param c the collection whose elements are to be placed into this list
     * @throws NullPointerException if the specified collection is null
     */
    public ArrayList(Collection<? extends E> c) {
        elementData = c.toArray();
        if ((size = elementData.length) != 0) {
            // c.toArray might (incorrectly) not return Object[] (see 6260652)
            if (elementData.getClass() != Object[].class)
                elementData = Arrays.copyOf(elementData, size, Object[].class);
        } else {
            // replace with empty array.
            this.elementData = EMPTY_ELEMENTDATA;
        }
    }

 3.ArrayList是如何实现动态扩容的?

一句话来说,就是:

ArrayList在添加元素前,会进行比较,如果现在所需总容量(即加入元素后数组的新长度)比原来的最大容量要大,则会进行扩容,新容量=旧容量*1.5

下面从添加元素出发,一步步去看看ArrayList是在什么时候并且怎样去扩容的。

开始:在指定下标 index处,添加元素 element

    public void add(int index, E element) {
        rangeCheckForAdd(index);            //检查下标范围

        ensureCapacityInternal(size + 1);  // 确定所需增长的容量大小并进行扩容,这个过程中同时增加了modCount的值!!
        System.arraycopy(elementData, index, elementData, index + 1,
                         size - index);    //
        elementData[index] = element;
        size++;
    }

(1)下标范围检查

    /**
     * A version of rangeCheck used by add and addAll.
     */
    private void rangeCheckForAdd(int index) {
        if (index > size || index < 0)
            throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
    }

(2)确定所需增长的最小容量,传入参数值为:当前数组中的元素数量+1,此处记为新长度

  public void ensureCapacity(int minCapacity) {
        int minExpand = (elementData != DEFAULTCAPACITY_EMPTY_ELEMENTDATA)
            // any size if not default element table
            ? 0
            //  是空表的话便返回0
            // 不是空表便返回默认值10
            : DEFAULT_CAPACITY;

        if (minCapacity > minExpand) {
            ensureExplicitCapacity(minCapacity);
        }
    }

    private static int calculateCapacity(Object[] elementData, int minCapacity) {
      //计算所需的最小容量,若原来数组为空,便返回所需的最小容量为默认值10
      //若原来数组不为空,便返回传入的新长度(比原来数组元素数目大一个)
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) { return Math.max(DEFAULT_CAPACITY, minCapacity); } return minCapacity; } private void ensureCapacityInternal(int minCapacity) { ensureExplicitCapacity(calculateCapacity(elementData, minCapacity)); } private void ensureExplicitCapacity(int minCapacity) { modCount++; // 若新长度大于当前数组长度了,便使用groww()方法动态增长 if (minCapacity - elementData.length > 0) grow(minCapacity); }

(3)根据传入的新长度值扩展原数组

 /**
     * Increases the capacity to ensure that it can hold at least the
     * number of elements specified by the minimum capacity argument.
     *
     * @param minCapacity the desired minimum capacity
     */
    private void grow(int minCapacity) {             //传入参数为新长度(原数组中元素数量+1)的值
        // overflow-conscious code
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1);        //新容量=旧容量*1.5
        if (newCapacity - minCapacity < 0)      //若扩容后,新容量仍比增长后所需的最小容量小,则新容量就等于新长度的值
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)       //若扩容后,新容量大于最大容量,则根据新长度的大小确定新容量的值
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

    private static int hugeCapacity(int minCapacity) {
        if (minCapacity < 0) // 若原数组中元素数量已经为Integer.MAX_VALUE,则int类型的minCapacity再加一便会溢出为负数
            throw new OutOfMemoryError();
        return (minCapacity > MAX_ARRAY_SIZE) ?   //若新长度大于最大容量,则新容量就等于Integer.MAX_VALUE,否则等于最大容量
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }

(4)将原数组元素复制至变长的新数组中,将给定元素插入,数组中元素数量加一

4.源码中多次出现的modCount变量的作用是什么?

  查看源码可以发现在其父类AbstractList中定义了一个int型的属性:modCount,记录了ArrayList结构性变化的次数。

 protected transient int modCount = 0; 

在ArrayList的所有涉及结构变化的方法中都增加modCount的值,包括:add()、remove()、addAll()、removeRange()及clear()方法。这些方法每调用一次,modCount的值就加1

modCount主要在多线程环境下需要使用,防止一个线程正在迭代遍历,另一个线程修改了这个列表的结构(包括添加删除元素,排序等)。一旦列表在被迭代器遍历时修改则会抛出异常:ConcurrentModificationException

 

 ArrayList是非线程安全的,所以当大家遍历那些非线程安全的数据结构时,尽量使用迭代器

posted @ 2020-03-16 00:27  pathjh  阅读(220)  评论(0编辑  收藏  举报