数据结构——ArrayList的源码分析(你所有的疑问,都会被解答)
一.首先来看一下ArrayList的类图
1,实现了RandomAccess接口,可以达到随机访问的效果。
2,实现了Serializable接口,可以用来序列化或者反序列化。
3,实现了List接口,是List的实现类之一
4,实现了Collection接口,是Collection家族的成员之一
5,实现了Iterable接口,代表可以对ArrayList进行For-each遍历。
二.然后咱们来看一下ArrayList的相关属性:
1,Long serialVersionUID = 8683452581122892189L,ArrayList序列化的版本ID。
2,Int DEFAULT_CAPACITY = 10,默认的初始容量为10
3,Final Object[] EMPTY_ELEMENTDATA = {},用于空实例的共享空数组实例。(new ArrayList(0))
4,Final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {},用于提供默认大小的实例的共享空数组实例。(new ArrayList())
5,transient Object[] elementData。存储ArrayList的数组缓冲区,ArrayList的容量是数组的长度。
6,Int size,ArrayList中元素的数量。
三.接着来看一下ArrayList的构造方法:
有参构造方法:很清晰的可以看出,如果initalCapacity>0,那么就创建一个新的长度为initalCapacity的ArrayList,如果initakCapacity=0,就用空实例的共享空数组实例EMPTY_ELEMENTDATA。其他情况就抛出非法请求。
无参构造方法:也可以很清晰的看出,如果用户不传入初始容量,那么ArrayList就会使将默认大小的实例的共享空数组实例赋值给elementData。
带集合参数的构造方法:
这也是将集合转换为数组的一个方法。@param c,集合,代表集合中的元素都会被放到List当中。@throws 如果集合为空,就抛出空指针异常。为了防止c.toArray不正确的执行,导致没有返回一个Object[],进行了相关的特殊处理。如果数组的大小等于0的话,那么就将默认的数组空实例大小赋值给elementData。
四.测试异常
那么为什么c.toArray会不返回一个Object[].class呢?来咱们写一些测试类,来测试一下。
如果c.toArray一直会返回Object[].class,那么输出的结果都会是java.lang.Object。但是测试结果如下图。显然从测试结果上,可以看出java.util.ArrayList会返回一个Object对象,但是java.util.Arrays$ArrayList(Array的私有内部类ArrayList)却返回了String对象。这是为什么呢?
翻看ArrayList的toArray方法,会发现使用了Array.copyOf方法。
那么我们继续往下走,看一下这个copyOf方法已经该方法的具体实现形式。
通过这个三元运算符,也能够看出这一个复制的逻辑。如果newType是Object类型的话,那么就返回数组的类型为Object,如果不是的话,就是newType类型的。而我们在ArrayList的toArray方法里面放入的elementData前面已经讲解过是Object类型的,所以ArrayList必然就是一个Object类型。
看完ArrayList内部的toArray源码之后,我们来看一下Array中的内部ArrayList的源码:
只截取了部分源码,可以看出内置的ArrayList是直接把接收到的数组赋值给a,然后通过toArray方法,直接把a的克隆返回,而这是传入的数据是什么类型,返回的就是什么类型。所以,在我们上面的例子中,实际上返回的是String类型的数组,再将其中的元素赋值成Object类型的,自然报错。
好,看完了ArrayList的属性和构造方法,咱们来看一下ArrayList的相关方法。
五.添加元素
在列表的最后添加元素,同时在父类中的abstractList中有记录modCount属性,用来记录数组修改的次数。
在指定位置添加指定的元素:
Index代表插入元素的位置,如果当前位置已经有了元素的话,那么就将该元素和元素后面的所有元素向后移一位,可能会抛出IndexOutOfBoundsException。这时候就需要考虑扩容了。
而这两个插入的方法还需要调用一些相关的私有方法。去计算当然的容量,保证ArrayList的容量健康,源码放下面了,因为比较简单,就不多说啦。
六.扩容机制
添加方法自然和扩容是分不开的。ArrayList自然也是有一套非常完善的扩容机制的,先前不是说了吗,如果在添加元素的时候容量不足,自然就需要扩容了。
1,MAX_ARRAY_SIZE代表了整个数组最大可以分配到的size,一些虚拟机再数组中预留了一些header—words,如果想要尝试分配更大的size,很有可能会报OOM的错误。
2,minCapacity:期望的最小容量,所以扩容一定要比这个数大。
3,最大容量返回Inter.MAX_VALUE。
正常情况下,新容量是原来容量的1.5倍,如果原容量的1.5倍比minCapacity小,那么就扩容到minCapacity,特殊情况扩容到Inter.MAX_VALUE这也就解释了为什么为什么空实例默认数组有的时候是EMPTY_ELEMENTDATA,而又有的时候是DEFAULTCAPACITY_EMPTY_ELEMENTDATA。New ArrayList()会将elementData赋值为DEFAULTCAPACITY_EMPTY_ELEMENTDATA,new ArrayLIst(0),会将elementData赋值为EMPTY_ELEMENTDATA。后者添加元素会扩容到容量为1,前者扩容之后容量为10。
七.删除的方法
删除指定下面元素的方法
1,index:删除的指定下标
2,下标越界会抛出IndexOutOfBoundsException
删除指定元素的方法
如果存在,那么删除返回true,否则的话返回false,o表示指定的元素
私有的移除方法:
私有的删除方法,跳过边界检查且不返回移除的元素。
八.查找的方法
查找指定元素所在的位置
查找指定位置的元素
这个方法直接返回elementData数组指定下标的元素,效率还是很高的,所以ArrayList的for循环遍历的效率还是很高的。
九.序列化方法
ArrayList是可以序列化和反序列化的,具体实现的方法如下:
将ArrayList的实例的状态保存到一个流里面。
根据一个流重新生成一个ArrayList。根据序列化的方法可以看出,elementData之所以用transient修饰,是因为JDK不想将整个elementData都序列化或者反序列化,而只是将size和实际存储的元素进行序列化或者反序列化,从而节省空间和时间。
十.创建子数组
SubList的set()方法,是直接修改ArrayList中的elementData数组的,所以在使用的时候一定要注意,同时SubList是没有实现Serializable接口的,所以是不能序列化的。
十一.迭代器
创建迭代器的方法,和Itr相关属性,hasNext()方法和next方法,cursor表示下一个要返回的元素的下标,lastRet表示最后一个元素的下标,没有元素返回-1,expectedModCount表示期望的count。
在迭代的时候,会检验modCount是否等于expectedModCount,不等于的话就会抛出著名的ConcurrentModificationException异常。