HashMap & HashSet & Hashtable

‍HashMap & HashSet & Hashtable
-----------------------------------------
HashMap
HashMap是使用链表的方式来解决HASH冲突的，另一种解决HASH冲突的方式见Thread.‍threadLocals的实现见ThreadLocal，
其实现的大致原理是对于一个PUT操作，会先去寻找KEY是否存在，如果存在则用新的VALUE来替换旧的VALUE，
如果不存在则将KEY-VALUE封装成一个Entry对象，
根据KEY的HASHCODE取模来确定Entry在Entry[] table对应的链表，加入到链表中...
1. 属性
Entry[] table -- 链表数组，其数据结构如下
-------------------------------------------
table[0] = Entry -> Entry -> Entry
table[1] = Entry -> null
table[2] = null
table[3] = Entry -> Entry
table[4] = null
--------------
Entry -- 数据结构
K key
V value
Entry<K,V> next -- 链表
int hash -- 根据key的HASHCODE计算出来的HASH值，HASHMAP有一个根据OBJECT的HASHCODE计算
HASH值的函数，保留这个值的原因是不想重复计算
-------------------------------------------
int size -- HASHMAP里面的元素个数
int threshold -- 限值，如果size超过这个值则table翻倍扩容，翻倍扩容后KEY的HASHCODE取模
对应的INDEX就变了，所以链表需要重组，这个值是使用size*loadFactor计算出来的
float loadFactor -- 扩容因子，用来size*loadFactor计算threshold
int modCount -- 此值和HASHMAP的迭代有关，因为HASHMAP的强一致性，而ConcurrentHashMap是弱一致性
2. 函数
a. HashMap 实例化函数，可以指定capacity和loadFactor，其中size如果不是2的幂则改成靠近capacity最近的大于
capacity的2的幂，初始化table为new Entry[capacity]
注意capacity默认是16，loadFactor默认是0.75

b. get(key) 获取值
1. 如果key是null，则遍历链表table[0]，至于遍历为什么是0，是因为计算null的INDEX是直接返回0
遍历过程中如果在链表table[0]上有一个Entry的key是null，则返回对应的value
2. 根据key的HASHCODE计算出来的HASH值，再使用capacity取模，找到其在的table[index]链表
再遍历这个链表，判断是同一个key的原则是
-------------------------------
实体KEY'HASHCODE相等 && (查找KEY==实体KEY || 查找KEY.equals(实体KEY))
这就是KEY为什么要实现hashCode和equals这两个函数，解决PUT和GET传入的KEY不一定是对同一个对象的引用
只要是equals返回TRUE就可以了
-------------------------------
如果条件满足则返回对应的value
c. containsKey(key) 判断key是否加入过，其过程和get(key)是一样的
d. put(key, value) 加入key-value的映射，
1. 如果key是null，首先会迭代链表table[0]看null之前是否被加入过，如果加入过则替换旧的值，返回旧的值
如果不存在，则实例化一个新的Entry对象，将这个对象放在链表table[0]的第一个
2. key不是null，则根据key的HASHCODE计算出来的HASH值，再使用capacity取模，找到其在的table[index]链表
再遍历这个链表，寻找key是否存在和get(key)的标准是一样的，如果加入过则替换旧的值，返回旧的值
否则实例化一个新的Entry对象，将这个对象放在链表table[index]的第一个
3. 只有在key不存在的条件下才会modCount会做++操作，标志MAP做了修改
4. 在key不存在的条件下，每次加入新元素都会去判断size是否大于了threshold
如果大于了则实例化一个新的table，其大小是原table大小的两倍，再迭代MAP中的所有元素，调用
PUT流程加入到新的TABLE中
e. remove(key) 移除值
1. 根据key的HASHCODE计算出来的HASH值，再使用capacity取模，找到其在的table[index]链表
再遍历这个链表，如果key是null，index=0
2. 在遍历过程中使用get(key)里面的判断key是否是同一个的规则找到Entry，如果存在则会做链表的删除
这个元素的操作，同时modCount会做++操作，标志MAP做了修改
f. clear() 清空MAP
1. 其主要做的事就是跌打数组table，做table[i]=null的操作
2. 同时modCount会做++操作，标志MAP做了修改
g. containsValue(value)
1. 两层迭代，第一层是table，第二层是table[i]对应的Entry链表
判断value存在的条件是，Entry.value.equals(value)，如果value是null，则看Entry.value == null
h. 对于MAP数据的迭代，注意MAP是线程不安全的，所有每次迭代时都会把目前的modCount传入
一旦MAP做了PUT新元素和REMOVE了元素则会抛出ConcurrentModificationException异常
-----------------------------------------
HashSet
HashSet实际上就是封装了一个HashMap
1. contains(key) -- HashMap.containsKey(key)
2. add(key) -- HashMap.put(key, PRESENT) -- PRESENT是一个固定的一个OBJECT
3. remove(key) -- HashMap.remove(key)
4. clear() HashMap.clear()
-----------------------------------------
Hashtable
Hashtable的实现和HashMap是一样的，区别如下
1. Hashtable将所有的函数都加了synchronized修饰，使得它是线程安全的MAP结构
2. Hashtable在计算get(key)时使用的逻辑和HashMap不一样
-------------------------------
实体KEY'HASHCODE相等 && 查找KEY.equals(实体KEY)
-------------------------------
-----------------------------------------

posted @ 2011-08-02 08:23 eoe星晴阅读(257) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

eoe星晴

HashMap & HashSet & Hashtable

公告