集合框架中常用类比较

集合框架设计软件时,记住该框架四个基本接口的下列层次结构关系会有用处:

· Collection 接口是一组允许重复的对象。 

· Set 接口继承 Collection,但不允许重复。 

· List 接口继承 Collection,允许重复,并引入位置下标。 

· Map 接口既不继承 Set 也不继承 Collection, 存取的是键值对 

我们以下面这个图表来描述一下常用的集合的实现类之间的区别:

Collection/Map

接口

成员重复性

元素存放顺序(Ordered/Sorted

元素中被调用的方法

基于那中数据结构来实现的

HashSet

Set

Unique elements

No order

equals()

hashCode()

Hash 

LinkedHashSet

Set

Unique elements

Insertion order

equals()

hashCode()

Hash 表和双向链表

TreeSet

SortedSet

Unique elements

Sorted

equals()

compareTo()

平衡树(Balanced tree

ArrayList

List

Allowed

Insertion order

equals()

数组

LinkedList

List

Allowed

Insertion order

equals()

链表

Vector

List

Allowed

Insertion order

equals()

数组

HashMap

Map

Unique keys

No order

equals()

hashCode()

Hash 

LinkedHashMap

Map

Unique keys

Key insertion order/Access order of entries

equals()

hashCode()

Hash 表和双向链表

Hashtable

Map

Unique keys

No order

equals()

hashCode()

Hash 

TreeMap

SortedMap

Unique keys

Sorted in key order

equals()

compareTo()

平衡树(Balanced tree

 

 

 

一、Array  Arrays

Java所有存储及随机访问一连串对象的做法,array是最有效率的一种。

1
效率高,但容量固定且无法动态改变。
array还有一个缺点是,无法判断其中实际存有多少元素,length只是告诉我们array的容量。

2Java中有一个Arrays类,专门用来操作array
       arrays中拥有一组static函数,
equals():比较两个array是否相等。array拥有相同元素个数,且所有对应元素两两相等。
fill():将值填入array中。
sort():用来对array进行排序。
binarySearch():在排好序的array中寻找元素。
System.arraycopy()array的复制。


二、Collection  Map

若撰写程序时不知道究竟需要多少对象,需要在空间不足时自动扩增容量,则需要使用容器类库,array不适用。

1Collection  Map 的区别

容器内每个为之所存储的元素个数不同。
Collection类型者,每个位置只有一个元素。
Map类型者,持有 key-value pair,像个小型数据库。

2Java2容器类类库的用途是保存对象,它分为两类,各自旗下的子类关系

Collection
       --List:将以特定次序存储元素。所以取出来的顺序可能和放入顺序不同。
             --ArrayList / LinkedList / Vector
       --Set  不能含有重复的元素
             --HashSet /TreeSet
Map
       --HashMap
    --HashTable
    --TreeMap

Map----一组成对的键值对对象,即其元素是成对的对象,最典型的应用就是数据字典,并且还有其它广泛的应用。另外,Map可以返回其所有键组成的Set和其所有值组成的Collection,或其键值对组成的Set,并且还可以像数组一样扩展多维Map,只要让Map中键值对的每个是一个Map即可。

Collection1.迭代器

迭代器是一种设计模式,它是一个对象,它可以遍历并选择序列中的对象,而开发人员不需要了解该序列的底层结构。迭代器通常被称为轻量级对象,因为创建它的代价小。

Java中的Iterator功能比较简单,并且只能单向移动:

(1) 使用方法iterator()要求容器返回一个Iterator。第一次调用Iteratornext()方法时,它返回序列的第一个元素。注意:iterator()方法是java.lang.Iterable接口,Collection继承。


(2) 使用next()获得序列中的下一个元素。

(3) 使用hasNext()检查序列中是否还有元素。

(4) 使用remove()将迭代器新返回的元素删除。

IteratorJava迭代器最简单的实现,为List设计的ListIterator具有更多的功能,它可以从两个方向遍历List,也可以从List中插入和删除元素。

2.List的功能方法

List(interface): 次序是List最重要的特点;它确保维护元素特定的顺序。ListCollection添加了许多方法,使得能够向List中间插入与移除元素(只推荐LinkedList使用)。一个List可以生成ListIterator,使用它可以从两个方向遍历List,也可以从List中间插入和删除元素。

ArrayList: 由数组实现的List。它允许对元素进行快速随机访问,但是向List中间插入与移除元素的速度很慢。ListIterator只应该用来由后向前遍历ArrayList,而不是用来插入和删除元素,因为这比LinkedList开销要大很多。

LinkedList: 由列表实现的List。对顺序访问进行了优化,向List中间插入与删除得开销不大,随机访问则相对较慢(可用ArrayList代替)。它具有方法addFirst()addLast()getFirst()getLast()removeFirst()removeLast(),这些方法(没有在任何接口或基类中定义过)使得LinkedList可以当作堆栈、队列和双向队列使用。

3.Set的功能方法

Set(interface): 存入Set的每个元素必须是唯一的,这也是与List不同的,因为Set不保存重复元素。加入SetObject必须定义equals()方法以确保对象的唯一性。SetCollection有完全一样的接口。Set接口不保证维护元素的次序。

HashSet: HashSet能快速定位一个元素,存入HashSet的对象必须定义hashCode()

TreeSet: 保持次序的Set,底层为树结构。使用它可以从Set中提取有序的序列。

LinkedHashSet: 具有HashSet的查询速度,且内部使用链表维护元素的顺序(插入的次序)。于是在使用迭代器遍历Set时,结果会按元素插入的次序显示。

HashSet采用散列函数对元素进行排序,这是专门为快速查询而设计的;TreeSet采用红黑树的数据结构进行排序元素;LinkedHashSet内部使用散列以加快查询速度,同时使用链表维护元素的次序,使得看起来元素是以插入的顺序保存的。需要注意的是,生成自己的类时,Set需要维护元素的存储顺序,因此要实现Comparable接口并定义compareTo()方法。

3、其他特征

*     ListSetMap将持有对象一律视为Object型别。
*     CollectionListSetMap都是接口,不能实例化。
      继承自它们的 ArrayList, Vector, HashTable, HashMap是具象class,这些才可被实例化。
*     vector容器确切知道它所持有的对象隶属什么型别。vector不进行边界检查。


三、Collections

Collections是针对集合类的一个帮助类。提供了一系列静态方法实现对各种集合的搜索、排序、线程完全化等操作。
相当于对Array进行类似操作的类——Arrays
如,Collections.max(Collection coll); coll中最大的元素。
       Collections.sort(List list); list中元素排序

四、如何选择?

1、容器类和Array的区别、择取
      *     容器类仅能持有对象引用(指向对象的指针),而不是将对象信息copy一份至数列某位置。
      *     一旦将对象置入容器内,便损失了该对象的型别信息。

2
     *     在各种Lists中,最好的做法是以ArrayList作为缺省选择。当插入、删除频繁时,使用LinkedList()
        Vector总是比ArrayList慢,所以要尽量避免使用。
     *     在各种Sets中,HashSet通常优于HashTree(插入、查找)。只有当需要产生一个经过排序的序列,才用TreeSet
        HashTree存在的唯一理由:能够维护其内元素的排序状态。
     *     在各种Maps
        HashMap用于快速查找。
     *     当元素个数固定,用Array,因为Array效率是最高的。

结论:最常用的是ArrayListHashSetHashMapArray。而且,我们也会发现一个规律,用TreeXXX都是排序的。


注意:

1Collection没有get()方法来取得某个元素。只能通过iterator()遍历元素。
2SetCollection拥有一模一样的接口。
3List可以通过get()方法来一次取出一个元素。使用数字来选择一堆对象中的一个,get(0)...(add/get)
4、一般使用ArrayListLinkedList构造堆栈stack、队列queue

5Map put(k,v) / get(k),还可以使用containsKey()/containsValue()来检查其中是否含有某个key/value
      HashMap会利用对象的hashCode来快速找到key
    *     hashing
          哈希码就是将对象的信息经过一些转变形成一个独一无二的int值,这个值存储在一个array中。
          我们都知道所有存储结构中,array查找速度是最快的。所以,可以加速查找。
      
          发生碰撞时,让array指向多个values。即,数组每个位置上又生成一个梿表。

6Map中元素,可以将key序列、value序列单独抽取出来。
使用keySet()抽取key序列,将map中的所有keys生成一个Set
使用values()抽取value序列,将map中的所有values生成一个Collection

为什么一个生成Set,一个生成Collection?那是因为,key总是独一无二的,value允许重复。

 

 

posted on 2013-08-01 19:58  you Richer  阅读(413)  评论(0编辑  收藏  举报