HashMap & HashSet & Hashtable

‍HashMap & HashSet & Hashtable
-----------------------------------------
HashMap
HashMap是使用链表的方式来解决HASH冲突的,另一种解决HASH冲突的方式见Thread.‍threadLocals的实现见ThreadLocal,
其实现的大致原理是对于一个PUT操作,会先去寻找KEY是否存在,如果存在则用新的VALUE来替换旧的VALUE,
如果不存在则将KEY-VALUE封装成一个Entry对象,
根据KEY的HASHCODE取模来确定Entry在Entry[] table对应的链表,加入到链表中...
1. 属性
Entry[] table -- 链表数组,其数据结构如下
-------------------------------------------
table[0] = Entry -> Entry -> Entry
table[1] = Entry -> null
table[2] = null
table[3] = Entry -> Entry
table[4] = null
--------------
Entry -- 数据结构
K key
V value
Entry<K,V> next -- 链表
int hash -- 根据key的HASHCODE计算出来的HASH值,HASHMAP有一个根据OBJECT的HASHCODE计算
HASH值的函数,保留这个值的原因是不想重复计算
-------------------------------------------
int size -- HASHMAP里面的元素个数
int threshold -- 限值,如果size超过这个值则table翻倍扩容,翻倍扩容后KEY的HASHCODE取模
对应的INDEX就变了,所以链表需要重组,这个值是使用size*loadFactor计算出来的
float loadFactor -- 扩容因子,用来size*loadFactor计算threshold
int modCount -- 此值和HASHMAP的迭代有关,因为HASHMAP的强一致性,而ConcurrentHashMap是弱一致性
2. 函数
a. HashMap 实例化函数,可以指定capacity和loadFactor,其中size如果不是2的幂则改成靠近capacity最近的大于
capacity的2的幂,初始化table为new Entry[capacity]
注意capacity默认是16,loadFactor默认是0.75

b. get(key) 获取值
1. 如果key是null,则遍历链表table[0],至于遍历为什么是0,是因为计算null的INDEX是直接返回0
遍历过程中如果在链表table[0]上有一个Entry的key是null,则返回对应的value
2. 根据key的HASHCODE计算出来的HASH值,再使用capacity取模,找到其在的table[index]链表
再遍历这个链表,判断是同一个key的原则是
-------------------------------
实体KEY'HASHCODE相等 && (查找KEY==实体KEY || 查找KEY.equals(实体KEY))
这就是KEY为什么要实现hashCode和equals这两个函数,解决PUT和GET传入的KEY不一定是对同一个对象的引用
只要是equals返回TRUE就可以了
-------------------------------
如果条件满足则返回对应的value
c. containsKey(key) 判断key是否加入过,其过程和get(key)是一样的
d. put(key, value) 加入key-value的映射,
1. 如果key是null,首先会迭代链表table[0]看null之前是否被加入过,如果加入过则替换旧的值,返回旧的值
如果不存在,则实例化一个新的Entry对象,将这个对象放在链表table[0]的第一个
2. key不是null,则根据key的HASHCODE计算出来的HASH值,再使用capacity取模,找到其在的table[index]链表
再遍历这个链表,寻找key是否存在和get(key)的标准是一样的,如果加入过则替换旧的值,返回旧的值
否则实例化一个新的Entry对象,将这个对象放在链表table[index]的第一个
3. 只有在key不存在的条件下才会modCount会做++操作,标志MAP做了修改
4. 在key不存在的条件下,每次加入新元素都会去判断size是否大于了threshold
如果大于了则实例化一个新的table,其大小是原table大小的两倍,再迭代MAP中的所有元素,调用
PUT流程加入到新的TABLE中
e. remove(key) 移除值
1. 根据key的HASHCODE计算出来的HASH值,再使用capacity取模,找到其在的table[index]链表
再遍历这个链表,如果key是null,index=0
2. 在遍历过程中使用get(key)里面的判断key是否是同一个的规则找到Entry,如果存在则会做链表的删除
这个元素的操作,同时modCount会做++操作,标志MAP做了修改
f. clear() 清空MAP
1. 其主要做的事就是跌打数组table,做table[i]=null的操作
2. 同时modCount会做++操作,标志MAP做了修改
g. containsValue(value)
1. 两层迭代,第一层是table,第二层是table[i]对应的Entry链表
判断value存在的条件是,Entry.value.equals(value),如果value是null,则看Entry.value == null
h. 对于MAP数据的迭代,注意MAP是线程不安全的,所有每次迭代时都会把目前的modCount传入
一旦MAP做了PUT新元素和REMOVE了元素则会抛出ConcurrentModificationException异常
-----------------------------------------
HashSet
HashSet实际上就是封装了一个HashMap
1. contains(key) -- HashMap.containsKey(key)
2. add(key) -- HashMap.put(key, PRESENT) -- PRESENT是一个固定的一个OBJECT
3. remove(key) -- HashMap.remove(key)
4. clear() HashMap.clear()
-----------------------------------------
Hashtable
Hashtable的实现和HashMap是一样的,区别如下
1. Hashtable将所有的函数都加了synchronized修饰,使得它是线程安全的MAP结构
2. Hashtable在计算get(key)时使用的逻辑和HashMap不一样
-------------------------------
实体KEY'HASHCODE相等 && 查找KEY.equals(实体KEY)
-------------------------------
-----------------------------------------

posted @ 2011-08-02 08:23  eoe星晴  阅读(257)  评论(0编辑  收藏  举报