HashTable介绍

Hashtable声明

public class Hashtable<K,V> extends Dictionary<K,V> implements Map<K,V>, Cloneable, java.io.Serializable

Hashtable继承于Dictionary类（Dictionary类声明了操作键值对的接口方法），实现Map接口（定义键值对接口）；

Hashtable大部分方法都加了synchronized关键字，所以虽然是线程安全的，但在多线程并发环境下的效率较低。

1、Hashtable的几个重要变量

private transient Entry<?,?>[] table：键值对/Entry数组，每个Entry本质上是一个单向链表的表头

private int threshold：rehash阈值，当超过该阈值会rehash（重排序）

private float loadFactor：装填因子

private transient int modCount = 0： Hashtable结构化修改次数，用来实现fail-fast机制；

private transient volatile Set<Map.Entry<K,V>> entrySet：键值对集合，不可重复；

private transient volatile Set<K> keySet：key的集合，不可重复；

private transient volatile Collection<V> values：value集合，可重复；

private static final int Max_ARRAY_SIZE = Integer.MAX_VALUE-8;：散列表容量经过n次扩容之后，设置上限的阈值

2、Hashtable的几个内部类

键值对—Entry

private static class Entry<K,V> implements Map.Entry<K,V> {
final int hash; //哈希值
final K key; //key
V value; //value
Entry<K, V> next; //下一个entry结点
...
// 计算键值对的hashCode
public int hashCode() {
// "^" 按位异或, hash在调用构造器时传入
return hash ^ Objects.hashCode(value);
}
}

Value集合——ValueCollection

private class ValueCollection extends AbstractCollection<V> {

        public Iterator<V> iterator() {

            return getIterator(VALUES);

        }

        public int size() {

            returncount;

        }

        public boolean contains(Object o) {

            return containsValue(o);

        }

        public void clear() {

            Hashtable.this.clear();

        }

    }

EntrySet集合

private class EntrySet extendsAbstractSet<Map.Entry<K,V>> {

        public Iterator<Map.Entry<K,V>>iterator() {

            return getIterator(ENTRIES);

        }

        publicboolean add(Map.Entry<K,V> o) {

            returnsuper.add(o);

        }

        ......

}

Keys集合

private class KeySet extendsAbstractSet<K> {

        public Iterator<K> iterator() {

            return getIterator(KEYS);

        }

        publicint size() {

            returncount;

        }

        public boolean contains(Object o) {

            return containsKey(o);

        }

        public boolean remove(Object o) {

            return Hashtable.this.remove(o) != null;

        }

        publicvoid clear() {

            Hashtable.this.clear();

        }

    }

3、Hashtable几个重要的方法分析

　　主要方法：Hashtable()、contains()、get()、rehash()、addEntry()、put(K,V)、remove(Object)，像size()、keys()、values()、isEmpty()、elements()

　　比较简单的就不介绍了。

(1) Hashtable

public Hashtable(int initialCapacity, float loadFactor) {

        if (initialCapacity < 0)

            throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity);

        if (loadFactor <= 0 || Float.isNaN(loadFactor))

            throw new IllegalArgumentException("Illegal Load: "+loadFactor);

        if (initialCapacity==0)

            initialCapacity = 1;

        this.loadFactor = loadFactor;

        table = new Entry<?,?>[initialCapacity];

        threshold = (int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1);

//threshold的计算方式，MAX_ARRAY_SIZE防止经过n次扩容后，数组大小超出整数的最大值，所以这里设定一个上限的阈值
}

   public Hashtable() { 

         this(11, 0.75f); //默认的table容量为11，装载因子为0.75

 }

(2) contains

public synchronized boolean contains(Object value) {

      if (value == null) {    //Hashtable的value不允许为空，不然会报空指针

                thrownew NullPointerException();

      }  

            Entry<?,?> tab[] = table;

            //从数组的最后往前遍历

            for (int i = tab.length ; i-- > 0 ;) {

            //再对每个entry链表进行遍历

                for (Entry<?,?> e = tab[i] ; e != null ; e = e.next) {

            //如果找到对应的value，返回true

                   if (e.value.equals(value)) {        

                       return true;

                   }

                }

            }

            //没找到返回false

            return false;

}

(3) containsKey

public synchronized boolean containsKey(Object key) {

            Entry<?,?> tab[] = table;

            int hash = key.hashCode();

            //计算数组的索引，Hashtable本质上采用除数取余法进行散列分布

            int index = (hash & 0x7FFFFFFF) %tab.length;

            for (Entry<?,?> e = tab[index] ; e != null ; e = e.next) {

                if ((e.hash == hash) && e.key.equals(key)){

                   return true;

                }

            }

            return false;

}

(4) get

public synchronized V get(Object key) {

            Entry<?,?> tab[] = table;

            int hash = key.hashCode();

            //通过key的hash值和table的length，经过运算得到散列表中的索引

            int index = (hash & 0x7FFFFFFF) %tab.length;

            //遍历tab[index]对应的链表

            for (Entry<?,?> e = tab[index] ; e != null ; e = e.next) {

            //如果entry的key和hash值与期望值一致，则返回

                if ((e.hash == hash) && e.key.equals(key)){

                   return (V)e.value;

                }

            }

            //否则返回空值

            return null;

 }

(5) rehash

@SuppressWarnings("unchecked")

        protectedvoid rehash() {

            //保存旧的容量和Entry数组

            int oldCapacity = table.length;

            Entry<?,?>[] oldMap = table;

            //定义新值，新的容量为旧值的2倍加1

            int newCapacity = (oldCapacity << 1) + 1;

            //判断新的容量是否超过了上限

            if (newCapacity - MAX_ARRAY_SIZE > 0) {

                if (oldCapacity == MAX_ARRAY_SIZE)            

                   return;

                newCapacity = MAX_ARRAY_SIZE;

            }

            //定义新的数组

            Entry<?,?>[] newMap = new Entry<?,?>[newCapacity];

            //此时，散列表内的元素发生变化，modCount指针加1

            modCount++;

            //重新计算新的threshold

            threshold = (int)Math.min(newCapacity * loadFactor, MAX_ARRAY_SIZE+ 1);

            table = newMap;

           

            //对散列表内的所有元素进行“重排列”，顺序从后往前

            for (int i = oldCapacity ; i-- > 0 ;) {

                //遍历oldMap[i]对应的entry链表

                for (Entry<K,V> old = (Entry<K,V>)oldMap[i]; old != null ; ) {

                   Entry<K,V> e = old;

                   old = old.next;

                //计算新数组的索引值

                   int index = (e.hash & 0x7FFFFFFF) %newCapacity;

               //先插入起始值     

                   e.next = (Entry<K,V>)newMap[index];

                //对应的向右侧移动

                   newMap[index] = e;

                /**

                 * 可能e.next = (Entry<K,V>)newMap[index];和newMap[index] = e;比较生硬，我们举例说明

                 * 第一次遍历时，newMap[index]为null,所以 e.next=null

                 * 第二次遍历时，假定e1=e.next, 然后 e1.next = e, newMap[index] = e1（起始点为e1）

                 * ...

                 * 依次进行，会发现链表中插入元素的顺序是“从左往右”

                 */

                }

            }

  }

(6) addEntry

private void addEntry(int hash, K key, V value, int index) {

             //modCount指针，对于修改操作不会自增，而对于内部元素数量的变化会自增

               modCount++;

               Entry<?,?> tab[] = table;

               //如果count大于阈值

               if (count >= threshold) {

                   //进行重排列操作

                    rehash();

                    tab = table;

                    hash = key.hashCode();

                    index = (hash & 0x7FFFFFFF) %tab.length;

               }

               //如果不大于阈值，则直接插入

               @SuppressWarnings("unchecked")

               Entry<K,V> e = (Entry<K,V>) tab[index];

               //如果e为空，将插入到起始位置，如果e不为空，则从左向右插入

                tab[index] = new Entry<>(hash, key, value, e);

                count++;

      }

(7) put

下图为jdk1.8的hashMap的put方法的过程，Hashtable和其类似，基本上“计算索引，逻辑判断”这个部分是一致的，差别在于Hashtable中没有用到红黑树。

public synchronized V put(K key, V value) {

            // 首先value不能为空

            if (value == null) {

                throw new NullPointerException();

            }                   

            Entry<?,?> tab[] = table;

            int hash = key.hashCode();

            int index = (hash & 0x7FFFFFFF) %tab.length;

            @SuppressWarnings("unchecked")

            //判断tab[index]是否已经有值

            Entry<K,V> entry = (Entry<K,V>)tab[index];

            //如果有值，则遍历

            for(; entry != null ; entry = entry.next) {

                //如果key重复，那么新的value覆盖旧值

                if ((entry.hash == hash) &&entry.key.equals(key)) {

                   V old = entry.value;

                   entry.value = value;

                   return old;

                }

            }

            //经过遍历，发现key并没有重复，进行插入操作

            addEntry(hash, key, value, index);

            return null;

   }

(8) remove

public synchronized V remove(Object key) {

            Entry<?,?> tab[] = table;

            int hash = key.hashCode();

            //计算索引

            int index = (hash & 0x7FFFFFFF) %tab.length;

            @SuppressWarnings("unchecked")

            //获得索引位置对应的Entry链表

            Entry<K,V> e = (Entry<K,V>)tab[index];

            //遍历链表中的entry元素

            for(Entry<K,V> prev = null ; e != null ; prev = e, e = e.next) {

                //如果找到需要的entry，进行删除

                if ((e.hash == hash) &&e.key.equals(key)) {

                   //修改指针加1

                   modCount++;

                   //如果prev结点非空

                   if (prev != null) {

                       //那么pre结点的next指针指向e的next,等价于e被删除

                       prev.next = e.next;

                   } else {

                       //否则，说明需要删除的为起始结点

                       tab[index] = e.next;

                   }

                   count--;

                   V oldValue = e.value;

                   e.value = null;

                   return oldValue;
                }
            }
            return null;
}

遍历HashTable相关介绍

1、遍历Hashtable的键值对(获取键值集)
第一步：根据entrySet()获取Hashtable的“键值对”的Set集合。
第二步：通过Iterator迭代器遍历“第一步”得到的集合。

// 假设table是Hashtable对象
// table中的key是String类型，value是Integer类型
Integer integ = null;
Iterator iter = table.entrySet().iterator();
while(iter.hasNext()) {
Map.Entry entry = (Map.Entry)iter.next();
// 获取key
key = (String)entry.getKey();
// 获取value
integ = (Integer)entry.getValue();
}

2、通过Iterator遍历Hashtable的键（获取键集）
第一步：根据keySet()获取Hashtable的“键”的Set集合。
第二步：通过Iterator迭代器遍历“第一步”得到的集合。

// 假设table是Hashtable对象
// table中的key是String类型，value是Integer类型
String key = null;
Integer integ = null;
Iterator iter = table.keySet().iterator();
while (iter.hasNext()) {
// 获取key
key = (String)iter.next();
// 根据key，获取value
integ = (Integer)table.get(key);
}

3、通过Iterator遍历Hashtable的值（获取值集）
第一步：根据value()获取Hashtable的“值”的集合。
第二步：通过Iterator迭代器遍历“第一步”得到的集合。

// 假设table是Hashtable对象
// table中的key是String类型，value是Integer类型
Integer value = null;
Collection c = table.values();
Iterator iter= c.iterator();
while (iter.hasNext()) {
value = (Integer)iter.next();
}

4、通过Enumeration遍历Hashtable的键（获取键集）
第一步：根据keys()获取Hashtable的集合。
第二步：通过Enumeration遍历“第一步”得到的集合。

Enumeration enu = table.keys();
while(enu.hasMoreElements()) {
System.out.println(enu.nextElement());
}

5、通过Enumeration遍历Hashtable的值（获取值集）
第一步：根据elements()获取Hashtable的集合。
第二步：通过Enumeration遍历“第一步”得到的集合。

Enumeration enu = table.elements();
while(enu.hasMoreElements()) {
System.out.println(enu.nextElement());
}

HashMap和Hashtable的区别

HashMap是非线程安全的，Hashtable是线程安全的，所以Hashtable重量级一些，因为使用了synchronized关键字来保证线程安全。
HashMap允许key和value都为null，而Hashtable都不能为null。
Hashtable继承自 JDK 1.0 的 Dictionary 虚拟类，而HashMap是 JDK 1.2 引进的 Map 接口的一个实现。
Hashtable和HashMap扩容的方法不一样，Hashtable中数组默认大小11，扩容方式是 old*2+1。HashMap中数组的默认大小是16，而且一定是2的指数，增加为原来的2倍。
两者通过hash值散列到hash表的算法不一样，Hashtable是古老的除留余数法，直接使用Object的hashcode，而后者是强制容量为2的幂，重新根据hashcode计算hash值，在使用hash和（hash表长度 – 1）进行与运算，也等价取膜，但更加高效，取得的位置更加分散，偶数，奇数保证了都会分散到。前者就不能保证。
HashMap的迭代器(Iterator)是fail-fast迭代器，而Hashtable的enumerator迭代器不是fail-fast的。所以当有其它线程改变了HashMap的结构（增加或者移除元素），将会抛出ConcurrentModificationException，但迭代器本身的remove()方法移除元素则不会抛出ConcurrentModificationException异常。

posted @ 2019-11-24 16:09 王大军阅读(211) 评论(0) 编辑收藏举报

刷新页面返回顶部