HashMap1

HashMap

1.1 HashMap特性？

　　HashMap的特性：HashMap存储键值对，实现快速存取数据；允许null键/值；非同步；实现map接口。

1.2 HashMap的原理，内部数据结构？

　　HashMap是基于hashing的原理，底层使用哈希表（数组 + 链表）实现。里边最重要的两个方法put、get，使用put(key, value)存储对象到HashMap中，使用get(key)从HashMap中获取对象。
　　存储对象时，我们将K/V传给put方法时，它调用hashCode计算hash从而得到bucket位置，进一步存储，HashMap会根据当前bucket的占用情况自动调整容量(超过Load Facotr则resize为原来的2倍)。获取对象时，我们将K传给get，它调用hashCode计算hash从而得到bucket位置，并进一步调用equals()方法确定键值对。如果发生碰撞的时候，Hashmap通过链表将产生碰撞冲突的元素组织起来，在Java 8中，如果一个bucket中碰撞冲突的元素超过某个限制(默认是8)，则使用红黑树来替换链表，从而提高速度。

1.3 HashMap 中 put 方法过程？

1.对key的hashCode做hash操作，然后再计算在bucket中的index（1.5 HashMap的哈希函数）；
2.如果没碰撞直接放到bucket里；
3.如果碰撞了，以链表的形式存在buckets后；
4.如果节点已经存在就替换old value(保证key的唯一性)
5.如果bucket满了(超过阈值，阈值=loadfactor*current capacity，load factor默认0.75)，就要resize。

1.4 get()方法的工作原理？

　　通过对key的hashCode()进行hashing，并计算下标，从而获得buckets的位置。如果产生碰撞，则调用用key.equals()方法。

1.5 HashMap 怎样解决冲突？

　　HashMap中处理冲突的方法实际就是链地址法，内部数据结构是数组+单链表。

1.6 除了HashMap，处理hash冲突还有那些解决办法？

　　开放定址法、再哈希法。

1.7 如果两个键的hashcode相同，你如何获取值对象？

　　重点在于理解hashCode()与equals()。
　　通过对key的hashCode()进行hashing，并计算下标，从而获得buckets的位置。两个键的hashcode相同会产生碰撞，则利用key.equals()方法去链表或树（java1.8）中去查找对应的节点。

1.8 针对 HashMap 中某个 Entry 链太长，查找的时间复杂度可能达到 O(n)，怎么优化？

　　将链表转为红黑树。JDK1.8 已经实现了。

1.9 如果HashMap的大小超过了负载因子(load factor)定义的容量，怎么办？

　　扩容。这个过程也叫作rehashing，因为它重建内部数据结构，并调用hash方法找到新的bucket位置。
　　大致分两步：
　　1.扩容：容量扩充为原来的两倍（2 * table.length）；
　　2.移动：对每个节点重新计算哈希值，重新计算每个元素在数组中的位置，将原来的元素移动到新的哈希表中。
　　
补充：
loadFactor：加载因子。默认值0.75；
capacity：容量；
threshold：阈值=capacity*loadFactor。当HashMap中存储数据的数量达到threshold时，就需要将HashMap的容量加倍（capacity*2）；
size：HashMap的大小，它是HashMap保存的键值对的数量。

1.10 为什么String, Interger这样的类适合作为键？

　　String, Interger这样的类作为HashMap的键是再适合不过了，而且String最为常用。
　　因为String对象是不可变的，而且已经重写了equals()和hashCode()方法了。
　　1.不可变性是必要的，因为为了要计算hashCode()，就要防止键值改变，如果键值在放入时和获取时返回不同的hashcode的话，那么就不能从HashMap中找到你想要的对象。不可变性还有其他的优点如线程安全。
　　2.因为获取对象的时候要用到equals()和hashCode()方法，那么键对象正确的重写这两个方法是非常重要的。如果两个不相等的对象返回不同的hashcode的话，那么碰撞的几率就会小些，这样就能提高HashMap的性能。

二、HashMap与HashTable区别

　　Hashtable可以看做是线程安全版的HashMap。Hashtable几乎在每个方法上都加上synchronized（同步锁），实现线程安全。

2.1 区别

　　1.HashMap继承于AbstractMap，而Hashtable继承于Dictionary；
　　2.线程安全不同。Hashtable的几乎所有函数都是同步的，即它是线程安全的，支持多线程。而HashMap的函数则是非同步的，它不是线程安全的。若要在多线程中使用HashMap，需要我们额外的进行同步处理；
　　3.null值。HashMap的key、value都可以为null。Hashtable的key、value都不可以为null；
　　4.迭代器(Iterator)。HashMap的迭代器(Iterator)是fail-fast迭代器，而Hashtable的enumerator迭代器不是fail-fast的。所以当有其它线程改变了HashMap的结构（增加或者移除元素），将会抛出ConcurrentModificationException。
　　5.容量的初始值和增加方式都不一样：HashMap默认的容量大小是16；增加容量时，每次将容量变为“原始容量x2”。Hashtable默认的容量大小是11；增加容量时，每次将容量变为“原始容量x2 + 1”；
　　6.添加key-value时的hash值算法不同：HashMap添加元素时，是使用自定义的哈希算法。Hashtable没有自定义哈希算法，而直接采用的key的hashCode()。
　　7.速度。由于Hashtable是线程安全的也是synchronized，所以在单线程环境下它比HashMap要慢。如果你不需要同步，只需要单一线程，那么使用HashMap性能要好过Hashtable。

2.2 能否让HashMap同步？

　　HashMap可以通过下面的语句进行同步：Map m = Collections.synchronizeMap(hashMap)

posted @ 2018-09-04 17:49 一个骄傲的少年阅读(143) 评论(0) 收藏举报

刷新页面返回顶部

一个骄傲的少年

专注于开发、思考、文字