HashMap原理详解
HashMap
一 定义和创建
HashMap实现了Map接口,继承AbstractMap类。AbstractMap中包含了map的基本功能。
(1) 初始大小
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
从源码可以看出大小是16(1左移动4位1000 = 16)
static final int MAXIMUM_CAPACITY = 1 << 30;
最大长度是2的30次方1073741824 基本能满足绝大部分需求的使用。
static final float DEFAULT_LOAD_FACTOR = 0.75f;
默认的负载因子是0.75 ,默认的负载因子一般不需要改动。如果更加关注内存空间,而不怎么关注速度,可以调大负载因子,反之,如果更加关注HashMap读写速度,而不太关注内存空间,则可以调小负载因子。
二 put方法,HASHMAP写入值,get方法读取值
从1.7之前的hashMap是用数组table+链表实现的,而在1.8jdk中队hashMap做了优化,通过数组,链表,红黑树(二叉树的一种)来实现,链表数组长度超过8时,转成红黑树从而提高了HashMap的效率。
(1)1.7中 hashMap的put方法详解:
public V put(K key, V value) { // 如果 key 为 null,调用 putForNullKey 方法进行处理 if (key == null) return putForNullKey(value); // 根据 key 的 keyCode 计算 Hash 值,hash函数为一个数学方法用位运算继续计算hash值 int hash = hash(key.hashCode()); // 查找hash值在table中的索引(此处的indexfor方式是一个数学方法, 返回值为 hash&table.length-1 ,通过位运算,保证此函数的返回值总是小于等于table.length,这样能确保i值在table数组的索引之内) int i = indexFor(hash, table.length); // 如果 i 索引处的 Entry 不为 null,通过循环不断遍历 e 元素的下一个元素 // table的i处存放的Entry中next值记录了链表情况,可能有多个Entry链,所以此时对链表循环处理 for (Entry<K,V> e = table[i]; e != null; e = e.next) { Object k; // 1.找到key值的hash值与插入值的hash值相同的key,并且key的值要与插入的key值相同, // 2.两者同时满足才能判断插入的是同一个key( 不同key值的hash值可能相等(hash碰撞),所以此处要增加key值自身的判断) if (e.hash == hash && ((k = e.key) == key || key.equals(k))) { //key值相同时直接替换value值,跳出函数 V oldValue = e.value; e.value = value; e.recordAccess(this); return oldValue; } } // 如果 i 索引处的 Entry 为 null 或者key的hash值相同而key不同 ,则需要新增Entry modCount++; // 将 key、value 添加到 i 索引处 addEntry(hash, key, value, i); return null; }
下面通过viso图来简要描述流程
addEntry这个函数这里在简单的说一下,先上代码
//table数组节点中新增 Entry void addEntry(int hash, K key, V value, int bucketIndex) { // 获取指定 bucketIndex 索引处的 Entry Entry<K,V> e = table[bucketIndex]; // ① //将新创建的 Entry 放入 bucketIndex 索引处,并让新的 Entry 指向原来的 Entry //此处分为两种情况 //1.table中i出无元素,则 e的值为null,新插入的Entry的next为null,无链表 //2.table中i处存在元素,新插入的元素会覆盖数组中的位置,同时新创建的Entry中next指向老元素的,形成链表。 table[bucketIndex] = new Entry<K,V>(hash, key, value, e); // 如果 Map 中的 key-value 对的数量超过了极限 if (size++ >= threshold) // 把 table 对象的长度扩充到 2 倍。 resize(2 * table.length); // ② }
在table的指定位置添加Entry元素,如果已经有entry元素,用新增的Entry替代老元素,但在entry中的next记录原元素的位置,实现链表查询。
到这里基本上put方法的原理基本上就清晰明了,下面看一下get方法
public V get(Object key) { // 如果 key 是 null,调用 getForNullKey 取出对应的 value if (key == null) return getForNullKey(); // 根据该 key 的 hashCode 值计算它的 hash 码 int hash = hash(key.hashCode()); // 直接取出 table 数组中指定索引处的值, for (Entry<K,V> e = table[indexFor(hash, table.length)]; e != null; // 搜索该 Entry 链的下一个 Entr e = e.next) // ① { Object k; // 如果该 Entry 的 key 与被搜索 key 相同 if (e.hash == hash && ((k = e.key) == key || key.equals(k))) return e.value; } return null; }
先通过hash方法查到在数组中的位置,查找出entry并通过entry的next做遍历,查到key值对应的value
三 jdk1.8中hashMap的区别(简述)
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { Node<K,V>[] tab; Node<K,V> p; int n, i; //如果table空,初始化table数组 if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; //查到i出元素为空 ,则在i位置新增Node元素 //注:此处i = (n - 1) & hash此方法即是jdk1.7中的indexFor方法,通过数学位运算,取的一个在table的长度范围内的值) if ((p = tab[i = (n - 1) & hash]) == null) //没有查到key ,新增节点 tab[i] = newNode(hash, key, value, null); else { Node<K,V> e; K k; //索引处的key值和key的hash值匹配,则直接把p节点指针传给临时变量e if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) e = p; else if (p instanceof TreeNode)//如果p节点是红黑树,特殊处理 e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); else {//遍历链表,处理key值的hash冲突情况 for (int binCount = 0; ; ++binCount) { if ((e = p.next) == null) {//在链表结尾处新增节点 p.next = newNode(hash, key, value, null);//链表原末尾元素next指向先创建的元素 if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); break; } if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k))))//检查key值和hash值是否同时相同 break; p = e; } } if (e != null) { // existing mapping for key 将新value值存放到节点处 V oldValue = e.value; if (!onlyIfAbsent || oldValue == null) e.value = value; afterNodeAccess(e); return oldValue; } } ++modCount; if (++size > threshold) resize(); afterNodeInsertion(evict); return null; }
主要新增了红黑树方法, 在key值产生冲突事,如果链表的长度超过8则转化成红黑树来实现,避免同一节点太长的链表影响效率。
posted on 2016-10-22 16:58 zhuanagyan 阅读(1622) 评论(0) 编辑 收藏 举报