java集合之ArrayList分析

概述

ArrayList是List集合的列表经典实现,其底层采用定长数组实现,可以根据集合大小进行自动扩容。

代码基于jdk1.8

public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable
{

特点

  1. 快速随机访问
  2. 允许存放多个null元素
  3. 底层是Object数组
  4. 增加元素个数可能很慢(可能需要扩容),删除元素可能很慢(可能需要移动很多元素),改对应索引元素比较快

ArrayList底层实现原理

底层数据结构

数组

类成员变量

//默认初始化大小
private static final int DEFAULT_CAPACITY = 10;
//空列表数据,初始化如果没有指定大小,则将此值赋予elementData
private static final Object[] EMPTY_ELEMENTDATA = {};
//默认空列表数据,如果没有指定大小,那么将此值赋予elementData
private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
//列表数据
transient Object[] elementData;//transient标识是不被序列化
//列表大小
private int size;

注意到,底层容器数组的前面有一个transient关键字,啥意思??

查阅资料后,大概知道:transient标识之后是不被序列化的

但是ArrayList实际容器就是这个数组为什么标记为不序列化??那岂不是反序列化时会丢失原来的数据?

其实是ArrayList在序列化的时候会调用writeObject(),直接将size和element写入ObjectOutputStream;反序列化时调用readObject(),从ObjectInputStream获取size和element,再恢复到elementData。

原因在于elementData是一个缓存数组,它通常会预留一些容量,等容量不足时再扩充容量,那么有些空间可能就没有实际存储元素,采用上诉的方式来实现序列化时,就可以保证只序列化实际存储的那些元素,而不是整个数组,从而节省空间和时间。

常见方法

构造方法

从第一个构造方法可以看到,如果没有指定大小,那么就将elementData赋值为DEFAULTCAPACITY_EMPTY_ELEMENTDATA。
而从第二个构造方法可以看到,如果指定了大小为0,那么就将elementData赋值为EMPTY_ELEMENTDATA。

//空构造方法
public ArrayList() {
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
//指定大小
public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }
//指定初始集合
public ArrayList(Collection<? extends E> c) {
        elementData = c.toArray();
        if ((size = elementData.length) != 0) {
            // c.toArray might (incorrectly) not return Object[] (see 6260652)
            if (elementData.getClass() != Object[].class)
                elementData = Arrays.copyOf(elementData, size, Object[].class);
        } else {
            // replace with empty array.
            this.elementData = EMPTY_ELEMENTDATA;
        }
    }

插入add()方法

插入一共有两种实现方式,第一种是直接插入列表尾部,另一种是插入某个位置

/**
 * Inserts the specified element at the specified position in this
 * list. Shifts the element currently at that position (if any) and
 * any subsequent elements to the right (adds one to their indices).
 *
 * @param index index at which the specified element is to be inserted
 * @param element element to be inserted
 * @throws IndexOutOfBoundsException {@inheritDoc}
 */
//直接插入尾部
public boolean add(E e) {
    ensureCapacity(size + 1);  // Increments modCount!!
    elementData[size++] = e;
    return true;
}

/**
 * Inserts the specified element at the specified position in this
 * list. Shifts the element currently at that position (if any) and
 * any subsequent elements to the right (adds one to their indices).
 *
 * @param index index at which the specified element is to be inserted
 * @param element element to be inserted
 * @throws IndexOutOfBoundsException {@inheritDoc}
 */
//插入某个位置
public void add(int index, E element) {
    rangeCheckForAdd(index);

    ensureCapacity(size+1);  // Increments modCount!!
    System.arraycopy(elementData, index, elementData, index + 1,
                     size - index);
    elementData[index] = element;
    size++;
}


private void rangeCheck(int index) {
    if (index >= size)
        throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}
  • 如果是直接插入尾部的话,那么只需调用ensureCapacityInternal方法做容量检测。如果空间足够,那么就插入,空间不够就扩容后插入。
  • 如果是插入的是某个位置,那么就需要将index之后的所有元素后移一位,之后再将元素插入至index处

查找get()方法

获取的源码非常简单,只需对index做有效性校验。
如果参数合法,那么直接返回对应数组下标的数据

public E get(int index) {
    rangeCheck(index);
    return elementData(index);
}


E elementData(int index) {
    return (E) elementData[index];
}

删除remove()方法

ArrayList的删除方法有两个,分别是:

  • 删除某个位置的元素:remove(int index)
  • 删除某个具体的元素:remove(Object o)
    我们先来看第一个删除方法:删除某个位置的元素
/**
 * Removes the element at the specified position in this list.
 * Shifts any subsequent elements to the left (subtracts one from their
 * indices).
 *
 * @param index the index of the element to be removed
 * @return the element that was removed from the list
 * @throws IndexOutOfBoundsException {@inheritDoc}
 */
public E remove(int index) {
    rangeCheck(index);

    modCount++;
    E oldValue = elementData(index);

    int numMoved = size - index - 1;
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index,
                         numMoved);
    elementData[--size] = null; // Let gc do its work

    return oldValue;
}

上述代码的逻辑大致是这样的:首先做参数范围检测,接着将index位置后的所有元素都往前挪一位,最后减少列表大小。

第二个删除方法:删除某个特定的元素。

/**
 * Removes the first occurrence of the specified element from this list,
 * if it is present.  If the list does not contain the element, it is
 * unchanged.  More formally, removes the element with the lowest index
 * <tt>i</tt> such that
 * <tt>(o==null&nbsp;?&nbsp;get(i)==null&nbsp;:&nbsp;o.equals(get(i)))</tt>
 * (if such an element exists).  Returns <tt>true</tt> if this list
 * contained the specified element (or equivalently, if this list
 * changed as a result of the call).
 *
 * @param o element to be removed from this list, if present
 * @return <tt>true</tt> if this list contained the specified element
 */
public boolean remove(Object o) {
    if (o == null) {
        for (int index = 0; index < size; index++)
            if (elementData[index] == null) {
                fastRemove(index);
                return true;
            }
    } else {
        for (int index = 0; index < size; index++)
            if (o.equals(elementData[index])) {
                fastRemove(index);
                return true;
            }
    }
    return false;
}

上述代码的逻辑大致是:首先,遍历列表的所有元素,找到需要删除的元素索引,左后调用fastRemove方法删除该元素。我们继续看看fastRemove方法的实现。

/*
 * Private remove method that skips bounds checking and does not
 * return the value removed.
 */
//用私有的方法 fastRemove 方法跳过边界,不返回删除值。
private void fastRemove(int index) {
    modCount++;
    int numMoved = size - index - 1;
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index,
                         numMoved);
    elementData[--size] = null; // clear to let GC do its work
}

这里有一个疑问,那就是为什么不直接复用remove(int index)方法,而要新写一个方法。答案在 fastRemove 方法的注释中已经写了,就是为了跳过边界检查,提高效率。

扩容操作

扩容是ArrayList的核心方法,当插入的时候容量不足,便会触发扩容。我们可以看到在插入的两个方法中都调用了扩容方法——ensureCapacity。

/**
 * Increases the capacity of this <tt>ArrayList</tt> instance, if
 * necessary, to ensure that it can hold at least the number of elements
 * specified by the minimum capacity argument.
 *
 * @param   minCapacity   the desired minimum capacity
 */
public void ensureCapacity(int minCapacity) {
    modCount++;
    int oldCapacity = elementData.length;
    if (minCapacity > oldCapacity) {
        Object oldData[] = elementData;
        int newCapacity = (oldCapacity * 3)/2 + 1;//扩容为原来的1.5倍+1
        if (newCapacity < minCapacity)
            newCapacity = minCapacity;
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }
}

Arrays.copyOf()去浅拷贝。
java中一个对象包含一个指向字符串的字段,浅拷贝的意思就是拷贝这个对象,那么他们的这个字段指向字符串是同一个。

浅拷贝只复制指向某个对象的指针,而不复制对象本身,新旧对象还是共享同一块内存。但深拷贝会另外创造一个一模一样的对象,新对象跟原对象不共享内存,修改新对象不会改到原对象。

总结

经过上面的分析,我们可以知道ArrayList有如下特点:

  • 底层基于数组实现,读取速度快,修改慢(读取时间复杂度O(1)),修改复杂度O(n)。
  • 非线程安全
  • ArrayList每次默认扩容为原来的1.5倍。

参考文档

List集合之ArrayList分析

ArrayList源码解析

浅拷贝与深拷贝的区别

posted @ 2022-06-28 15:40  cfdroid  阅读(34)  评论(0编辑  收藏  举报