Java基础知识总结之类的集合

Java集合概述

  1、集合类也叫作容器类。它的功能相当于一个容器。可以存储数量不确定的数据,以及保存具有映射关系的数据(也被称为关联数组)。

  2、Java的集合(容器),它是用来”装对象的“(实际上是对象的引用,但习惯上都称为对象)。

  3、Java集合大致可以分为Set、List、Queue和Map四种体系。Set代表无序、不可重复的集合;List代表有序、允许重复的集合;而Map代表具有映射关系的集合,Java5又增加了Queue体系集合,代表一种队列集合实现。

   4、Java集合类主要由两个接口派生出来:Collection和Map,Collection和Map是Java集合框架的根接口,如下图所示是Collection接口、子接口及其实现类的继承树。

 

 

注:斜体字代表接口,正体的为实现类。

  用蓝框标注的类是Collection集合框架最常用的实现类,分别是:HashSet、TreeSet、ArrayList、LinkedList、ArrayDeque。

 

Set集合

Set集合几乎等同于Collection集合。它们的行为几乎一致。

 遍历Set的两种方式:

  1.用迭代器

  2.用foreach循环

 

1.HashSet

HashSet的存储机制

  1、当有元素加进来的时,HashSet会调用该对象的hashCode()方法,得到一个int值。

  2、根据hashCode的()返回的int值,计算出它在HashSet中的存储位置(底层实际采用数组存储元素的索引,计算得到在数组中的索引值)

  3、如果加入的位置为空,则直接加入,如果该位置已经有元素,则此处会形成链表。

取元素时与此类似。

  1、当要去一个元素时,HashSet会调用该对象的hashCode()方法,得到一个int值。

  2、根据hashCode的()返回的int值,计算出它在HashSet的【底层数组】中的存储位置(数组中的索引)。

  3、如果该位置恰好是要找的元素,直接取出即可,如如果该位置由链表,则要通过”挨个“搜索链表中的元素。

HashSet存储机制示意图

 

 

HashSet的构造方法:HashSet(int initialCapacity, float loadFactor)

  initialCapacity:控制底层数组的长度,默认为16

  loadFactor:负载因子,HashSet判断是否【底层数组快满】时的依据。当判断认为数组快满时,系统会自动创建一个长度为原来2倍的数组,并且将原来数组的元素复制到新数组,原来的数组成为了垃圾。专业术语叫做”rehash(重hash)“。

  loadFactor的默认大小为0.75。

  loadFactor越小,越消耗内存,loadFactor越大,性能越低。

 

hashSet怎样判断两个对象是否相等: 

  1、两个对象的hashCode()返回值相同

  2、两个对象的equals()方法比较返回值为true

  这就要求我们自定义类的hashCode()和equals()方法是一致的,要求重写equals()所用的关键属性与计算hashCode()的关键属性一致。  

 

2. HashSet的子类:LinkedHashSet

  它与HashSet的存储机制相同。

  但LinkedHashSet额外维护一个链表,用来记录元素的添加顺序。

 

3.TreeSet

  特征:保证Set里的元素是”有大小排序“的。

  TreeSet————它是标准的红黑树

    树—>二叉树—>排序二叉树—>平衡二叉树—>红黑树。

  TreeSet的存储机制:

    底层由一棵”红黑树“存放所有的数据。存取性能与检索性能也比较好。

    在HashSet没有出现大量的链表的情况下,HashSet的性能要比TreeSet性能好。

  TreeSet要求对象必须是可以排序的:

    1、自然排序。要求所有的集合元素实现Comparable接口。

           集合元素实现了Comparable接口后,集合元素自身就可以排序。

    2、定制排序。要求创建TreeSet对象的时候传入一个Comparator对象。

           Comparator对象负责对集合元素进行排序,集合元素无需实现Comparable接口。

  TreeSet怎样才算两个对象时相等?

    1、只有两个对象通过compareTo()方法比较的返回值为0,TreeSet才认为两个对象相等。

 

 

List集合

  List集合封装了线性表的数据结构。

   它提供大量的”根据索引“来存、取元素的方法。

  由于List根据索引来存、取元素,因此它多了一个遍历元素的方法。

 

1.ArrayList

 ArrayList与Vector的存储机制

  它们的底层是基于数组的,它们对元素的存储完全是基于数组的。 —— 因此性能非常快。

  

 ArrayList与Vector的区别

  1、Vector是JDK1.0就有的集合,从JDK1.2以后SUN公司重新设计了ArrayList来代替Vector。

  2、Vector是线程安全的,ArrayList是线程不安全的。但ArrayList的性能要比Vector的好。

  即使在多线程的环境下,可以使用Collections的方法把ArrayList变成线程安全的。

以下仅供了解  

  3、当底层数组的存储空间不足时,Vector默认扩转1倍,ArrayList默认扩展%50+1。

 

2.LinkedList

  既是线性表,又是队列,还是栈。(栈和队列是受限的线性表)。

  LinkedList的底层是基于链表实现的。通常认为它的性能比不上ArrayList。

    ArrayList:由于根据底层数组的索引存取元素的,所以性能非常快。

          当插入、删除元素时,后面所有的元素都要跟上”整体搬家“。

    LinkedList:由于底层采用链表来存储元素,要根据遍历来存取元素,所以性能较低。

          当插入、删除元素时,后面所有的元素无需”整体搬家“,因此性能非常好。

 

Queue集合

Deque类

  双向队列:功能限制的线性表

  即使队列,又是栈。

  当作栈是使用的方法是push()和pop(),peek()只访问栈顶元素,并不弹出来。

  当作队列时使用的方法是offer()和poll()。

 

  ArrayDeque —— 基于数组实现

  LinkedList    —— 基于链表实现

 

操作集合工具类:Collections

  synchronizedXxx  —— 把原有的集合包装成线程安全的集合。

  shuffle(List<?> list) —— 把List集合元素进行随机排列

 

常见的工具类:

  Arrays       —— 操作数组。

  Objects     —— 操作对象。

  Collections ——操作集合。

 

 

Map集合

如下图为Map体系的继承树,所有的Map实现类用于保存具有映射关系的数据。Map保存的数据都是key-value对。

注:用蓝框标注的类是Map集合框架最常用的实现类,分别是:HashMap、TreeMap、Properties。

 

                                                 

 

对比以上两图,发现二者的结构非常相识,Map与Set一一对应。实质上Set底层的实现就是通过Map子类的方法,可以通过查看Set相关的API文档验证。当Map的value值为null,只考虑key的时候,Map就变为了Set。

  HashSet底层是由HashMap实现,HashMap通过“hash”算法控制数据在集合中的存储,类似于“一个萝卜一个坑”。

  TreeSet底层是由TreeMap实现,TreeMap就是真正的红黑树。

注:对于Map而言,value只是它的附属物,几乎没有什么要求,因此Map主要是对key由要求。

 

1.HashMap

  HashMap会通过key的hashCode()方法的返回值来计算其存、取位置。

  HashMap怎样才算两个key重复呢?

    1、通过equals()方法比较的返回值为true

    2、两个key的hashCode()返回值相同

 

判断两个对象相等可以用hashcode比较吗?

回答是不可以。你必须用equals方法!两个不同对象可能hashcode相等,但两个不同hashcode的对象一定不同。另外一点,如果覆写 了equals方法,必须覆写hashcode方法,原因是默认的hashcode是将对象的存储地址进行映射。而且逻辑上,如果两个对象的equals 方法返回是相等的,那么它们的hashcode必须相等;反之不一定成立。


 

2.TreeMap

  底层的红黑树只对key进行排序

  TreeMap要求key必须是可以排序的:

    1、自然排序。要求所有的key实现Comparable接口。

    2、定制排序。要求创建TreeMap对象的时候传入一个Comparator接口的对象。

  TreeMap怎样才算两个key相等?

    1、通过compareTo()方法比较的返回值为0,这就表明两个元素相等。

 

HashMap与HashTable的区别

  1、HashTable是从JDK1.0就有的,尽量少用。

  2、HashTable不允许null作为key、value。但HashMap允许。

  3、HashTable是线程安全的(实现的不好)

    HashMap是线程不安全的。因为它不需要进行同步检验,所以性能好。

    Map Collections.synchronizedMap(Map m)

    这个方法返回一个同步的Map,这个Map封装了底层的HashMap的所有方法,使得底层的HashMap即使是在多线程的环境中也是安全的。

以下几条仅供了解:

  4、HashTable中hash数组默认大小是11,增加的方式是 old*2+1。HashMap中hash数组的默认大小是16,而且一定是2的指数。

  5、哈希值的使用不同,HashTable直接使用对象的hashCode, 而HashMap重新计算hash值。

  6、.HashTable使用Enumeration,HashMap使用Iterator。

  7、HashTable有一个contains(Object value),功能和containsValue(Object value)功能一样。

  8、.Hashtable是Dictionary的子类,HashMap是Map接口的一个实现类;

posted on 2015-07-15 19:20  niuman  阅读(598)  评论(1编辑  收藏  举报

导航