最近在看Vector与ArrayList的源码,看下他们的区别与联系。

  1. Vector是线程安全的集合类,ArrayList并不是线程安全的类。Vector类对集合的元素操作时都加了synchronized,保证线程安全。
  2. Vector与ArrayList本质上都是一个Object[] 数组,ArrayList提供了size属性,Vector提供了elementCount属性,他们的作用是记录集合内有效元素的个数。与我们平常调用的arrayList.size()和vector.size()一样返回的集合内有效元素的个数。
  3. Vector与ArrayList的扩容并不一样,Vector默认扩容是增长一倍的容量,Arraylist是增长50%的容量。
  4. Vector与ArrayList的remove,add(index,obj)方法都会导致内部数组进行数据拷贝的操作,这样在大数据量时,可能会影响效率。
  5. Vector与ArrayList的add(obj)方法,如果新增的有效元素个数超过数组本身的长度,都会导致数组进行扩容。

  先看下他们的源码是怎么定义内部数据存储的:

 1 private static final long serialVersionUID = 8683452581122892189L;
 2 
 3     /**
 4      * Default initial capacity.
 5      */
 6     private static final int DEFAULT_CAPACITY = 10;
 7 
 8     /**
 9      * Shared empty array instance used for empty instances.
10      */
11     private static final Object[] EMPTY_ELEMENTDATA = {};
12 
13     /**
14      * The array buffer into which the elements of the ArrayList are stored.
15      * The capacity of the ArrayList is the length of this array buffer. Any
16      * empty ArrayList with elementData == EMPTY_ELEMENTDATA will be expanded to
17      * DEFAULT_CAPACITY when the first element is added.
18      */
19     private transient Object[] elementData;
20 
21     /**
22      * The size of the ArrayList (the number of elements it contains).
23      *
24      * @serial
25      */
26     private int size;

这是ArrayList的定义,他首先定义了他的初始化容量为10

private static final int DEFAULT_CAPACITY = 10

这里应该看到了数据存储是放在Object数组里的

private transient Object[] elementData

 定义了数据的长度size 

The size of the ArrayList (the number of elements it contains)

再看看Vector的定义:

 1  /**
 2      * The array buffer into which the components of the vector are
 3      * stored. The capacity of the vector is the length of this array buffer,
 4      * and is at least large enough to contain all the vector's elements.
 5      *
 6      * <p>Any array elements following the last element in the Vector are null.
 7      *
 8      * @serial
 9      */
10     protected Object[] elementData;
11 
12     /**
13      * The number of valid components in this {@code Vector} object.
14      * Components {@code elementData[0]} through
15      * {@code elementData[elementCount-1]} are the actual items.
16      *
17      * @serial
18      */
19     protected int elementCount;
20 
21     /**
22      * The amount by which the capacity of the vector is automatically
23      * incremented when its size becomes greater than its capacity.  If
24      * the capacity increment is less than or equal to zero, the capacity
25      * of the vector is doubled each time it needs to grow.
26      *
27      * @serial
28      */
29     protected int capacityIncrement;

 

Vector定义了数组

protected Object[] elementData;

有效元素个数

protected int elementCount

Vector增长容量,默认0

protected int capacityIncrement

Vector和ArrayList在元素超过初始大小时扩容是不一样的,但是也不像网上说的Vector增长是按一倍增长,我觉得应该加默认两个字才对,Vector中的元素个数超过了初始化容量的话,默认确实会增长一倍,请看代码:

 1  /**
 2      * The maximum size of array to allocate.
 3      * Some VMs reserve some header words in an array.
 4      * Attempts to allocate larger arrays may result in
 5      * OutOfMemoryError: Requested array size exceeds VM limit
 6      */
 7     private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
 8 
 9     private void grow(int minCapacity) {
10         // overflow-conscious code
11         int oldCapacity = elementData.length;
12         int newCapacity = oldCapacity + ((capacityIncrement > 0) ?
13                                          capacityIncrement : oldCapacity);
14         if (newCapacity - minCapacity < 0)
15             newCapacity = minCapacity;
16         if (newCapacity - MAX_ARRAY_SIZE > 0)
17             newCapacity = hugeCapacity(minCapacity);
18         elementData = Arrays.copyOf(elementData, newCapacity);
19     }

代码里在判断增长容量(简称增量)参数时如果增量大于0时,是会按增量进行扩容的,否则的话才会增加一倍的容量到数组中。

而Vector在初始化加载构造函数时,开发人员是可以指定其增量的大小的,并不是必须要根据增加一倍的规则进行增加。还是看代码:

 1  public Vector(int initialCapacity, int capacityIncrement) {
 2         super();
 3         if (initialCapacity < 0)
 4             throw new IllegalArgumentException("Illegal Capacity: "+
 5                                                initialCapacity);
 6         this.elementData = new Object[initialCapacity];
 7         this.capacityIncrement = capacityIncrement;
 8     }
 9 
10     /**
11      * Constructs an empty vector with the specified initial capacity and
12      * with its capacity increment equal to zero.
13      *
14      * @param   initialCapacity   the initial capacity of the vector
15      * @throws IllegalArgumentException if the specified initial capacity
16      *         is negative
17      */
18     public Vector(int initialCapacity) {
19         this(initialCapacity, 0);
20     }
21 
22     /**
23      * Constructs an empty vector so that its internal data array
24      * has size {@code 10} and its standard capacity increment is
25      * zero.
26      */
27     public Vector() {
28         this(10);
29     }

可以看到在构造函数中已经表明,可以指定其增量的大小,如果没有指定默认0。数组的初始化大小为10。

但是ArrayList就不可以进行增量的修改指定。还是看代码:

 1 /**
 2      * Increases the capacity to ensure that it can hold at least the
 3      * number of elements specified by the minimum capacity argument.
 4      *
 5      * @param minCapacity the desired minimum capacity
 6      */
 7     private void grow(int minCapacity) {
 8         // overflow-conscious code
 9         int oldCapacity = elementData.length;
10         int newCapacity = oldCapacity + (oldCapacity >> 1);  //看这里
11         if (newCapacity - minCapacity < 0)
12             newCapacity = minCapacity;
13         if (newCapacity - MAX_ARRAY_SIZE > 0)
14             newCapacity = hugeCapacity(minCapacity);
15         // minCapacity is usually close to size, so this is a win:
16         elementData = Arrays.copyOf(elementData, newCapacity);
17     }

首先在构造函数中,ArrayList就没有提供相应的设置增量的方法,而扩容方法grow中直接就对数组进行增量50%的操作了,并没有相应的参数设置或判断增量的大小。

在上边都提到了一个静态常量是private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

这个常量是数组扩容的最大长度,但是为什么-8呢我看了上边的描述,感觉应该是:

Some VMs reserve some header words in an array.

有些虚拟机会在数组头部加入一些信息,如果还是设置最大的话,可能会导致OOM

这就是Vector和ArrayList在扩容及成员变量方面的区别及联系了。

接下来我们看看他们的源码中插入、删除等方法为什么说和LinkedList相比要慢

先看代码:

 
1
public synchronized void insertElementAt(E obj, int index) { 2 modCount++; 3 if (index > elementCount) { 4 throw new ArrayIndexOutOfBoundsException(index 5 + " > " + elementCount); 6 } 7 ensureCapacityHelper(elementCount + 1); 8 System.arraycopy(elementData, index, elementData, index + 1, elementCount - index); 9 elementData[index] = obj; 10 elementCount++; 11 }

Vector集合在add(int index, E element)时实际上调用了insertElementAt方法,他和删除方法实际上都是对数组进行了copy,所以在大数据量时可能会导致效率降低。ArrayList也是这样的情况。

但是在增加调用add(E e)方法时,其实就是在数组中追加数据了,如果追加数据的长度大于实际数组长度的话,会进入到grow扩容方法进行扩容。

Vector和ArrayList都提供了trimToSize()方法,这个方法是对数组容量进行缩减的方法。在这个方法中,调用方法时会对数组的元素容量及数组本身长度进行判断,如果数组内实际元素的个数比数组本身的长度少的话,调用这个方法会将数组缩减到元素个数大小。在数据量大的时候可以考虑这样做,这样可以节省不必要的空间浪费。看代码:

1 public void trimToSize() {
2         modCount++;
3         if (size < elementData.length) {
4             elementData = Arrays.copyOf(elementData, size);
5         }
6     }

Vector本身提供了一个同步方法叫setSize方法,该方法可以对当前集合进行长度设置。如果设置的长度比当前元素个数要大的话会进行判断是否需要扩容,如果不是,在给定的Size值外的元素将被置为空值。

看代码:

 1 public synchronized void setSize(int newSize) {
 2         modCount++;
 3         if (newSize > elementCount) {
 4             ensureCapacityHelper(newSize);
 5         } else {
 6             for (int i = newSize ; i < elementCount ; i++) {
 7                 elementData[i] = null;
 8             }
 9         }
10         elementCount = newSize;
11     }

这大体上就是Vector和ArrayList的区别

 

ps:以上只是个人理解,如有不对请指正。