容器--Collection和AbstractCollection

一、前言

     容器是JAVA中比较重要的一块,整个体系设计得非常好,同时对于代码学习来说也是比较好的范例。同时很多面试官也比较喜欢用容器来考察面试者的基础知识,所以掌握好容器还是比较重要的。本文主要总结一下所有容器的公共接口之一Collection以其抽象实现AbstractCollection.

 

二、Collection介绍

     JDK的官方文档对Collection的定义是这样的:The root interface in the collection hierarchy. A collection represents a group of objects, known as its elements. Some collections allow duplicate elements and others do not. Some are ordered and others unordered. 

  通过定义我们知道Collection表示一组对象,根据集合类型的不同,有的允许重复元素,有的是有序的,这个要看具体的子接口的实现情况。Collection接口中定义一些通用的方法。这些方法都比较基本而且使用都比较频繁,所以我们需要对每一个方法都记录,按方法的作用我们可以分为以下几类:

      1. 添加

      共两个方法,分别是add和addAll, 分别是接收一个对象和一个Collection对象。

      2. 删除

      共四个方法,remove, removeAll, retainAll,clear, 其中需要说的是retainAll,这个操作接受一个Collection作为参数,取两个集合的交集。

      3. 查找

      共两个方法, contains, containsAll, 判断集合中是否有某个或某些元素

      4. 转换

      共三个方法, toArray(), toArray(T t[])和iterator, 前两个是把集合转化为数组,另外一个是转化为一个Iterator对象,可用于遍历,这个方法其实在其父接口Iterable中也有定义。

      5. 求大小

      共两个方法, size()和isEmpty(), 分别是求长度和判断集合是否为空。

      6. 比较

      共两个方法,equals和hashCode,这两个方法是从object中继承过来的。

      以上共15个方法,大多数还是很好理解。需要重点关注的是转换类的两个方法,由于Collection继承了Iterable,所以所有的collection都可以通过foreach的方式来调用,这是JDK1.5之后的一种语法糖。

      关于Collection的介绍就到这里,下面接着看一下其直接骨架类AbstractCollection.

三、AbstractCollection介绍

      虽然Collection中的方法很多,其不同子类型的表现也不一样,但事实上这15个方法中有很多都是跟具体的子类没有关系的,为了简化具体Collection类的设计, JDK提供了一个抽象类AbstractCollection,对其中的大多数方法进行了实现。

      方法的实现没有必要依次去介绍,这里主要介绍这个子类的一些特点及几个重要方法的实现。

      1. 本类默认是不是可修改的,即不支持add,由于addAll依赖于add,所以addAll也是不支持的,要支持添加功能,就需要重写这个add方法

      2. size,iterator这两个方法没有实现,所以要编写自己的collection,需要实现这两个方法即可。

      3. 其它所有方法都有实现,不过涉及到遍历的都依赖于iterator()返回的迭代器,删除也依赖于迭代器提供的删除方法。

      4. 本类没有对equals和hashCode进行重写,但是对toString进行了重写。

      大部分方法的实现很容易理解,下面重点介绍一下toArray。

四、重点方法分析

     Collection可以直接转化为数组,本接口中有两个方法,Object[] toArray()和<T> T[] toArray(T[] a),相信有些人和我一样,在使用时会感觉到困惑,一是不知道使用哪个方法,二是不知道第二个方法的参数和返回值之间有什么关系,下面我们就来认真分析一下。

     先看一下JDK对于这个方法的定义描述:The returned array will be "safe" in that no references to it are maintained by this collection. (In other words, this method must allocate a new array even if this collection is backed by an array). The caller is thus free to modify the returned array.

      从这个描述我们可以知道toArray得到的数组跟原collection没有任何关系,我们可以对数组的每个引用值做修改,而不会影响到原collection.这个看起来好像是多余说明的,但是考虑到ArrayList其实就是基于数组实现的,那这个限制保证了即使是将ArrayList转化为数组,那也应该是分配一个新数组,而不是返回原来的数组。

      好了,我们再看一下具体的代码。

     

 1     public Object[] toArray() {
 2         // Estimate size of array; be prepared to see more or fewer elements
 3         Object[] r = new Object[size()];
 4         Iterator<E> it = iterator();
 5         for (int i = 0; i < r.length; i++) {
 6             if (! it.hasNext()) // fewer elements than expected
 7                 return Arrays.copyOf(r, i);
 8             r[i] = it.next();
 9         }
10         return it.hasNext() ? finishToArray(r, it) : r;
11     }
12 
13     private static <T> T[] finishToArray(T[] r, Iterator<?> it) {
14         int i = r.length;
15         while (it.hasNext()) {
16             int cap = r.length;
17             if (i == cap) {
18                 int newCap = cap + (cap >> 1) + 1;
19                 // overflow-conscious code
20                 if (newCap - MAX_ARRAY_SIZE > 0)
21                     newCap = hugeCapacity(cap + 1);
22                 r = Arrays.copyOf(r, newCap);
23             }
24             r[i++] = (T)it.next();
25         }
26         // trim if overallocated
27         return (i == r.length) ? r : Arrays.copyOf(r, i);
28     }
29 
30 
31     private static int hugeCapacity(int minCapacity) {
32         if (minCapacity < 0) // overflow
33             throw new OutOfMemoryError
34                 ("Required array size too large");
35         return (minCapacity > MAX_ARRAY_SIZE) ?
36             Integer.MAX_VALUE :
37             MAX_ARRAY_SIZE;
38     }

上面是AbstractCollection的实现,可以看到对于toArray()来说,就是分配了一个等大空间的数组,然后依次对数组元素进行赋值。

如果我们在单线程操作的情况下,collection集合大小不变,正常应该是执行到 return it.hasNext() ? finishToArray(r, it) : r; 这条语句结束,但考虑到在复制的过程中,collection的集合可能会有变化,可能是变大也可能是变小,所以方法增加了对这种情况的处理,这就是为什么每次循环都要判断是collection是否遍历完,以及最后再判断collection是否变得更长,如果是的话,还需要重新再为array分配空间。

通常情况下,我们不会执行到hugeCapacity,但作为一个框架来说,这体现了设计时的严谨。

可以看到,toArray返回的是一个Object数组,不能很好的体现collection中的元素类型,这样collection的泛型就无法体现出优势。所以,我们又有了第二个方法。个人当时在使用这个方法是,最大的疑惑就在于不知道这个参数应该怎么传,下面我们来看下具体的实现。

 1 public <T> T[] toArray(T[] a) {
 2         // Estimate size of array; be prepared to see more or fewer elements
 3         int size = size();
 4         T[] r = a.length >= size ? a :
 5                   (T[])java.lang.reflect.Array
 6                   .newInstance(a.getClass().getComponentType(), size);
 7         Iterator<E> it = iterator();
 8 
 9         for (int i = 0; i < r.length; i++) {
10             if (! it.hasNext()) { // fewer elements than expected
11                 if (a == r) {
12                     r[i] = null; // null-terminate
13                 } else if (a.length < i) {
14                     return Arrays.copyOf(r, i);
15                 } else {
16                     System.arraycopy(r, 0, a, 0, i);
17                     if (a.length > i) {
18                         a[i] = null;
19                     }
20                 }
21                 return a;
22             }
23             r[i] = (T)it.next();
24         }
25         // more elements than expected
26         return it.hasNext() ? finishToArray(r, it) : r;
27     }

我们可以看到,方法在处理里,会先判断参数数组的大小,如果空间足够就使用参数作为元素存储,如果不够则新分配一个。在循环中的判断也是一样,如果参数a能够存储则返回a,如果不能再新分配。在看了这个之后,对于这新代码strList.toArray(new String[0])相信就很容易理解了。

在看了这两个方法后,我相信对于toArray的区别和使用就比较容易掌握了,个人建议还是使用第二种比较好一些,在参数的选择上,要么传递一个0长度的数组,要么就传递一个与集合等长的数组,但考虑到集合的可变性,我们应该使用这个方法的返回值,而不是直接使用参数数组。

 

五、总结

总的来说,Collection和AbstractCollection还是比较简单,但只有掌握了这两个简单的类,在学习后续的各种list和set的时候,我们才能更好的理解。

      

 

posted @ 2016-07-30 15:29  海上劳工  阅读(1118)  评论(0编辑  收藏  举报