Hashtable与HashMap引发的血案(java)(转)
人物:
王小胖:性别:男。程序员,工作经验 1 year 。爱好:吃肉、电玩、马小花。特技:吃肉不用考虑胃的容量。
马小花:性别:女。学生,工作经验 0 year 。爱好:蛋糕、臭美、王小胖。特技:能够降服王小胖……
/**2011 年 2 月, 电影《将爱情进行到底》火得不得了。周末,小胖也陪着小花去看这部电影。放映中,小花被影片中的靖哥哥和杜拉拉感动的一沓糊涂,而小胖则心里暗自后悔没有 买一袋大爆米花来打发这无聊的时间。影片结束,小花已经是鼻涕一把泪一把,小胖也只有装模作样地抽动了几下鼻子,一心只想着一会儿是吃麦当劳还是必胜客。 */
回到家中,小胖和小花各自玩着电脑。
小花:胖子,你知道 Hashtable 和 HashMap 的区别吗?
小胖:略知。
小花:……装什么!!给我讲讲!!!
小胖:好的……
第一个区别就先来说说继承关系吧。
如果你在baidu里google一下(技术类文章的搜索还是 推荐google),会发现网上的大致说法与“由于Java发展的历史原因。Hashtable是基于陈旧的Dictionary类的,HashMap是 Java 1.2引进的Map接口的一个实现。”相同。这种说法没有错,但是胖子觉得不够准确,特别是对于我们这种大众菜鸟来说,如果不去深究的话,可能就会造成一 些理解上的差异。简单的认为Hashtable 没有继承Map接口。胖子之前就犯过这样的错误(胖子承认自己笨,是真笨……) 。
小花:那你怎么知道它们两个各自的继承关系呢?胖子。
我们可以参考一下最新的JDK1.6的源码,看看这两个类的定义:
public class Hashtable<K,V> extends Dictionary<K,V> implements Map<K,V>, Cloneable, java.io.Serializable {…} public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable {…}
可以看到hashtable也是继承了Map接口。它们的不同是 Hashtable(since JDK1.0)就继承了Dictionary这个抽象类,而HashMap(since JDK1.2)继承的则是AbstractMap这个抽象类。因为在Hashtable中看到继承Map后所实现的方法是JDK1.2版本时加上去的,所 以胖子猜想可能是在JDK 1.2开发时Sun工程师出于统一的考虑使得Hashtable也继承了Map接口。
小花:哦,原来 JDK 源码还能看出来这个。
小胖:……后面还能看出更多东西的。
小花:好期待啊。
第二个区别我们从同步和并发性上来说说它们两个的不同。
可以通过这两个类得源码来分析,Hashtable中的主要方法 都做了同步处理,而HashMap则没有。可以说Hashtable在默认情况支持同步,而HashMap在默认情况下是不支持的。我们在多线程并发的环 境下,可以直接使用Hashtable,但是要使用HashMap的话就要自己增加同步处理了。对HashMap的同步处理可以使用 Collections类提供的synchronizedMap静态方法;或者直接使用JDK5.0之后提供的java.util.concurrent 包里的ConcurrentHashMap类。
小胖: synchronizedMap 静态方法和 ConcurrentHashMap 类我会以后再给你详细讲一下的。肥婆。
小花:你保证啊。钥匙忘了你知道后果的。
小胖:好的……
第三个区别就是它们对于 null 值的处理方式了。
我们依然能够从源代码中得知,Hashtable中,key和value都不允许出现null值。
public synchronized V put(K key, V value) { // Make sure the value is not null if (value == null) { throw new NullPointerException(); } // Makes sure the key is not already in the hashtable. Entry tab[] = table; int hash = key.hashCode(); int index = (hash & 0x7FFFFFFF) % tab.length; //… }
在我们使用上面的方法时,如参数value为null,可以从代码中直接看出程序会抛出NullPointerException;而在key为null时,则会在“int hash = key.hashCode();“这段计算Hash值的过程中抛出NullPointerException。 而 在在HashMap中,允许null作为key存在,并且和其他key的特性一样,这样的null值key只能有一个;另外HashMap允许多个 value为null。这样大家就要注意了, HashMap中就不能用get(key)方法来判断HashMap中是否存在某个key,因为value 为null和不存在该key的Entry都会返回null值,而应该用containsKey()方法来判断了。
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class TestCase { public static void main(String[] args) { Map<Integer,String> hashMap = new HashMap<Integer,String>(); hashMap.put(0, null); hashMap.put(1, "one"); hashMap.put(2, "two"); hashMap.put(null, "null"); for(Entry<Integer, String> e : hashMap.entrySet()) { System.out.println("Key: " + e.getKey() + " -- Value: " + e.getValue()); } System.out.println(hashMap.get(0)); System.out.println(hashMap.get(4)); System.out.println("Contains key 0 ? :" + hashMap.containsKey(0)); System.out.println("Contains key 4 ? :" + hashMap.containsKey(4)); System.out.println("Contains value null ? :" + hashMap.containsValue(null)); } }
Key: null -- Value: null Key: 0 -- Value: null Key: 1 -- Value: one Key: 2 -- Value: two null null Contains key 0 ? :true Contains key 4 ? :false Contains value null ? :true
HashMap对于null值key的处理网上有说 “null 用new Object()来代替,其Entry.hashCode=0,而且在取出的时候还会还回null的。”胖子我在读取源码的过程中看到了null值的 hash值确实是0 (内部实现的数组中的index也是),但是能力有限没有看到转为new Object()的过程。
小花: 原来 hashMap 的 containsKey 还有这么个陷阱,以后肥婆要小心了。
第四个不同就是它们两个 Hash 值的获取方式了。
还是通过源代码源代码,Hashtable是直接使用key对象的hash值。
public synchronized V put(K key, V value) { // Make sure the value is not null if (value == null) { throw new NullPointerException(); } // Makes sure the key is not already in the hashtable. Entry tab[] = table; int hash = key.hashCode();//hashcode int index = (hash & 0x7FFFFFFF) % tab.length; //… }
而HashMap则是利用key对象的hash值重新计算一个新的hash值。
public V put(K key, V value) { if (key == null) return putForNullKey(value); int hash = hash(key.hashCode());//hashcode int i = indexFor(hash, table.length); //… } static int hash(int h) { h ^= (h >>> 20) ^ (h >>> 12); return h ^ (h >>> 7) ^ (h >>> 4); }
小花:胖子,都用了 hash 算法,你给我讲讲 Hash 算法吧。
小胖:嗯……以后的,今天我比较忙(其实是不会)。
小花:你是不是不会啊?嘿嘿(坏笑)。
小胖:什么不会……谈下一话题……
第五个不同就是 Hashtable 和 HashMap 它们两个内部实现方式的数组的初始大小和扩容的方式。
HashMap中内部数组的初始容量是16, 加载因子为0.75,而且数组容量增容后也要是2指数次幂:
/** * The default initial capacity - MUST be a power of two. */ static final int DEFAULT_INITIAL_CAPACITY = 16; /** * The load factor used when none specified in constructor. */ static final float DEFAULT_LOAD_FACTOR = 0.75f;
HashTable中的内部数组的初始容量是11,加载因子也是0.75数组的增容方式为(oldCapacity * 2 + 1):
public Hashtable() { this(11, 0.75f); } protected void rehash() { int oldCapacity = table.length; Entry[] oldMap = table; int newCapacity = oldCapacity * 2 + 1; //… }
第六个不同我们从它们两个遍历方式的内部实现上来说。
Hashtable HashMap都使用了 Iterator。而由于历史原因,Hashtable还使用了Enumeration的方式 。
小花: Iterator 和 Enumeration 的区别是什么啊?给我讲讲。
小胖:我不是说我没有时间嘛,下回的。
小花:我都记下来,省得你给我混过去。(拿起笔开始记账中)
小胖:……(紧张)
第七个不同时它们的拷贝构造函数的不同。
依然是通过查看源码,可以发现它们两个对于拷贝函数初始容量的不同值。
HashMap的实现是:
public HashMap(Map<? extends K, ? extends V> m) { this(Math.max((int) (m.size() / DEFAULT_LOAD_FACTOR) + 1, DEFAULT_INITIAL_CAPACITY), DEFAULT_LOAD_FACTOR); putAllForCreate(m); }
而Hashtable的实现是:
public Hashtable(Map<? extends K, ? extends V> t) { this(Math.max(2*t.size(), 11), 0.75f); putAll(t); }
小胖:今天讲的已经很多了。我有点饿了,肥婆。
小花:看你今天的表现这么好。走,带你去吃烤肉去。
小胖:哈哈,肥婆万岁。
PS:下面打算写的一些东西
TreeMap的排序及其他相关集合类
synchronizedMap的使用方式
concurrentMap实现细节和使用
Properties使用说明和 扩展
Iterator和Enumeration的区别
Hash算法 的实现