Java基础知识总结之类的集合

Java集合概述

　　1、集合类也叫作容器类。它的功能相当于一个容器。可以存储数量不确定的数据，以及保存具有映射关系的数据（也被称为关联数组）。

　　2、Java的集合（容器），它是用来”装对象的“（实际上是对象的引用，但习惯上都称为对象）。

　　3、Java集合大致可以分为Set、List、Queue和Map四种体系。Set代表无序、不可重复的集合；List代表有序、允许重复的集合；而Map代表具有映射关系的集合，Java5又增加了Queue体系集合，代表一种队列集合实现。

　　4、Java集合类主要由两个接口派生出来：Collection和Map，Collection和Map是Java集合框架的根接口，如下图所示是Collection接口、子接口及其实现类的继承树。

注：斜体字代表接口，正体的为实现类。

　　用蓝框标注的类是Collection集合框架最常用的实现类，分别是：HashSet、TreeSet、ArrayList、LinkedList、ArrayDeque。

Set集合

Set集合几乎等同于Collection集合。它们的行为几乎一致。

遍历Set的两种方式：

　　1.用迭代器

　　2.用foreach循环

1.HashSet

HashSet的存储机制：

　　1、当有元素加进来的时，HashSet会调用该对象的hashCode()方法，得到一个int值。

　　2、根据hashCode的()返回的int值，计算出它在HashSet中的存储位置（底层实际采用数组存储元素的索引，计算得到在数组中的索引值）

　　3、如果加入的位置为空，则直接加入，如果该位置已经有元素，则此处会形成链表。

取元素时与此类似。

　　1、当要去一个元素时，HashSet会调用该对象的hashCode()方法，得到一个int值。

　　2、根据hashCode的()返回的int值，计算出它在HashSet的【底层数组】中的存储位置（数组中的索引）。

　　3、如果该位置恰好是要找的元素，直接取出即可，如如果该位置由链表，则要通过”挨个“搜索链表中的元素。

HashSet存储机制示意图

HashSet的构造方法：HashSet(int initialCapacity, float loadFactor)

　　initialCapacity:控制底层数组的长度，默认为16

　　loadFactor：负载因子，HashSet判断是否【底层数组快满】时的依据。当判断认为数组快满时，系统会自动创建一个长度为原来2倍的数组，并且将原来数组的元素复制到新数组，原来的数组成为了垃圾。专业术语叫做”rehash（重hash）“。

　　loadFactor的默认大小为0.75。

　　loadFactor越小，越消耗内存，loadFactor越大，性能越低。

hashSet怎样判断两个对象是否相等：　

　　1、两个对象的hashCode()返回值相同

　　2、两个对象的equals()方法比较返回值为true

　　这就要求我们自定义类的hashCode()和equals()方法是一致的，要求重写equals()所用的关键属性与计算hashCode()的关键属性一致。　　

2. HashSet的子类:LinkedHashSet

　　它与HashSet的存储机制相同。

　　但LinkedHashSet额外维护一个链表，用来记录元素的添加顺序。

3.TreeSet

　　特征：保证Set里的元素是”有大小排序“的。

　　TreeSet————它是标准的红黑树

　　　　树—>二叉树—>排序二叉树—>平衡二叉树—>红黑树。

　　TreeSet的存储机制：

　　　　底层由一棵”红黑树“存放所有的数据。存取性能与检索性能也比较好。

　　　　在HashSet没有出现大量的链表的情况下，HashSet的性能要比TreeSet性能好。

　　TreeSet要求对象必须是可以排序的：

　　　　1、自然排序。要求所有的集合元素实现Comparable接口。

　　　　　　　　　　　集合元素实现了Comparable接口后，集合元素自身就可以排序。

　　　　2、定制排序。要求创建TreeSet对象的时候传入一个Comparator对象。

　　　　　　　　　　　Comparator对象负责对集合元素进行排序，集合元素无需实现Comparable接口。

　　TreeSet怎样才算两个对象时相等？

　　　　1、只有两个对象通过compareTo()方法比较的返回值为0，TreeSet才认为两个对象相等。

List集合

　　List集合封装了线性表的数据结构。

　　它提供大量的”根据索引“来存、取元素的方法。

　　由于List根据索引来存、取元素，因此它多了一个遍历元素的方法。

1.ArrayList

　ArrayList与Vector的存储机制：

　　它们的底层是基于数组的，它们对元素的存储完全是基于数组的。 —— 因此性能非常快。

　ArrayList与Vector的区别：

　　1、Vector是JDK1.0就有的集合，从JDK1.2以后SUN公司重新设计了ArrayList来代替Vector。

　　2、Vector是线程安全的，ArrayList是线程不安全的。但ArrayList的性能要比Vector的好。

　　即使在多线程的环境下，可以使用Collections的方法把ArrayList变成线程安全的。

以下仅供了解　　

　　3、当底层数组的存储空间不足时，Vector默认扩转1倍，ArrayList默认扩展%50+1。

2.LinkedList

　　既是线性表，又是队列，还是栈。（栈和队列是受限的线性表）。

　　LinkedList的底层是基于链表实现的。通常认为它的性能比不上ArrayList。

　　　　ArrayList：由于根据底层数组的索引存取元素的，所以性能非常快。

　　　　　　　　　　当插入、删除元素时，后面所有的元素都要跟上”整体搬家“。

　　　　LinkedList：由于底层采用链表来存储元素，要根据遍历来存取元素，所以性能较低。

　　　　　　　　　　当插入、删除元素时，后面所有的元素无需”整体搬家“，因此性能非常好。

Queue集合

Deque类

　　双向队列：功能限制的线性表

　　即使队列，又是栈。

　　当作栈是使用的方法是push()和pop()，peek()只访问栈顶元素，并不弹出来。

　　当作队列时使用的方法是offer()和poll()。

　　ArrayDeque —— 基于数组实现

　　LinkedList —— 基于链表实现

操作集合工具类：Collections

　　synchronizedXxx —— 把原有的集合包装成线程安全的集合。

　　shuffle(List<?> list) —— 把List集合元素进行随机排列

常见的工具类：

　　Arrays —— 操作数组。

　　Objects —— 操作对象。

　　Collections ——操作集合。

Map集合

如下图为Map体系的继承树，所有的Map实现类用于保存具有映射关系的数据。Map保存的数据都是key-value对。

注：用蓝框标注的类是Map集合框架最常用的实现类，分别是：HashMap、TreeMap、Properties。

对比以上两图，发现二者的结构非常相识，Map与Set一一对应。实质上Set底层的实现就是通过Map子类的方法，可以通过查看Set相关的API文档验证。当Map的value值为null，只考虑key的时候，Map就变为了Set。

　　HashSet底层是由HashMap实现，HashMap通过“hash”算法控制数据在集合中的存储，类似于“一个萝卜一个坑”。

　　TreeSet底层是由TreeMap实现，TreeMap就是真正的红黑树。

注：对于Map而言，value只是它的附属物，几乎没有什么要求，因此Map主要是对key由要求。

1.HashMap

　　HashMap会通过key的hashCode()方法的返回值来计算其存、取位置。

　　HashMap怎样才算两个key重复呢？

　　　　1、通过equals()方法比较的返回值为true

　　　　2、两个key的hashCode()返回值相同

判断两个对象相等可以用hashcode比较吗？

回答是不可以。你必须用equals方法！两个不同对象可能hashcode相等，但两个不同hashcode的对象一定不同。另外一点，如果覆写了equals方法，必须覆写hashcode方法，原因是默认的hashcode是将对象的存储地址进行映射。而且逻辑上，如果两个对象的equals 方法返回是相等的，那么它们的hashcode必须相等；反之不一定成立。

2.TreeMap

　　底层的红黑树只对key进行排序

　　TreeMap要求key必须是可以排序的：

　　　　1、自然排序。要求所有的key实现Comparable接口。

　　　　2、定制排序。要求创建TreeMap对象的时候传入一个Comparator接口的对象。

　　TreeMap怎样才算两个key相等？

　　　　1、通过compareTo()方法比较的返回值为0，这就表明两个元素相等。

HashMap与HashTable的区别：

　　1、HashTable是从JDK1.0就有的，尽量少用。

　　2、HashTable不允许null作为key、value。但HashMap允许。

　　3、HashTable是线程安全的（实现的不好）

　　　　HashMap是线程不安全的。因为它不需要进行同步检验，所以性能好。

　　　　Map Collections.synchronizedMap(Map m)

　　　　这个方法返回一个同步的Map，这个Map封装了底层的HashMap的所有方法，使得底层的HashMap即使是在多线程的环境中也是安全的。

以下几条仅供了解：

　　4、HashTable中hash数组默认大小是11，增加的方式是 old*2+1。HashMap中hash数组的默认大小是16，而且一定是2的指数。

　　5、哈希值的使用不同，HashTable直接使用对象的hashCode，而HashMap重新计算hash值。

　　6、.HashTable使用Enumeration，HashMap使用Iterator。

　　7、HashTable有一个contains(Object value)，功能和containsValue(Object value)功能一样。

　　8、.Hashtable是Dictionary的子类，HashMap是Map接口的一个实现类；

posted on 2015-07-15 19:20 niuman 阅读(598) 评论(1) 编辑收藏举报

刷新页面返回顶部

niuman