集合-Map<String,Integer> map = new HashMap<>()
new HashMap 数据结构:
- 底层是哈希表 / 散列表结构:一维数组,这个数组中每一个元素是一个单向链表。(数组和链表的结合体。)
- 数组:在查询方面效率很高,随机增删方面效率很低。
- 单向链表:在随机增删方面效率较高,在查询方面效率很低。哈希表将以上的两种数据结构融合,发挥各自的优点。
- HashMap集合的默认初始化容量是16,默认加载因子是0.75
- 这个默认加载因子是当HashMap集合底层数组的容量达到75%的时候,数组开始扩容。
- HashMap集合初始化容量必须是2的倍数,JDK官方推荐,为达到散列均匀,提高HashMap集合的存取效率。
- JDK8之后,如果哈希表单向链表,中元素超过8个,单向链表这种数据,结构会变成红黑树数据结构。
- 当红黑树上的节点数量小于6时,会重新把红黑树变成单向链表数据结构。
HashMap集合的key部分特点:
- 无序,不可重复。
- 为什么无序? 因为不一定挂到哪个单向链表上。
- 不可重复是怎么保证的? equals方法来保证HashMap集合的key不可重复。如果key重复了,value会覆盖。
- 放在HashMap集合key部分的元素其实就是放到HashSet集合中了。
- 所以HashSet集合中的元素也需要同时重写hashCode()+equals()方法。
哈希表HashMap散列分布均匀:
- 什么是散列分布不均?
- 假设将所有的hashCode()方法返回值固定为某个值,
- 那么会导致底层哈希表变成了纯单向链表。这种情况我们成为:散列分布不均匀。
- 什么是散列分布均匀?
- 假设有100个元素,10个单向链表,那么每个单向链表上有10个节点,这是最好的,是散列分布均匀的。
- 假设将所有的hashCode()方法返回值都设定为不一样的值,有什么问题?
- 不行,因为这样的话导致底层哈希表就成为一维数组了,没有链表的概念了。也是散列分布不均匀。
掌握的是两个方法的实现原理:
map.put(k,v)
v = map.get(k)
new HashMap 遍历:
Set<Map.Entry<K,V>> set = map.entrySet();
public class HashMapTest { public static void main(String[] args) { // 测试HashMap集合key部分的元素特点 // Integer是key,它的hashCode和equals都重写了。 Map<Integer,String> map = new HashMap<>(); map.put(11, "zhangsan"); map.put(66, "lisi"); map.put(77, "wangwu"); map.put(22, "zhaoliu"); map.put(22, "king"); //key重复的时候value会自动覆盖。 System.out.println(map.size()); // 4 // 遍历Map集合 Set<Map.Entry<Integer,String>> set = map.entrySet(); for(Map.Entry<Integer,String> entry : set){ // 验证结果:HashMap集合key部分元素:无序不可重复。 System.out.println(entry.getKey() + "=" + entry.getValue()); } } }
向Map集合中存,以及从Map集合中取,都是先调用key的hashCode方法,然后再调用equals方法!
- equals方法有可能调用,也有可能不调用。
- 拿put(k,v)举例,什么时候equals不会调用?
- k.hashCode()方法返回哈希值,哈希值经过哈希算法转换成数组下标,数组下标位置上如果是null,equals不需要执行。
- 拿get(k)举例,什么时候equals不会调用?
- k.hashCode()方法返回哈希值,哈希值经过哈希算法转换成数组下标。数组下标位置上如果是null,equals不需要执行。
hashCode()方法和equals()方法,直接使用IDEA工具生成,这两个方法需要同时生成。
- 如果一个类的equals方法重写了,那么hashCode()方法必须重写。
- equals方法返回如果是true,hashCode()方法返回的值必须一样。
- equals方法返回true表示两个对象相同,在同一个单向链表上比较。
- 那么对于同一个单向链表上的节点来说,他们的哈希值都是相同的。
- 所以hashCode()方法的返回值也应该相同。
- 放在HashMap集合key部分的,以及放在HashSet集合中的元素,需要同时重写hashCode方法和equals方法。
哈希表数据结构:哈希碰撞
- 如果元素o1和o2的 hash值相同,一定是放到同一个单向链表上。
- 如果元素o1和o2的hash值不同,但由于哈希算法执行结束之后转换的数组下标可能相同,此时会发生“哈希碰撞”。
HashMap集合key部分允许null吗?
- 允许HashMap集合的key和value都是可以为null的。
- HashMap集合的key null值只能有一个。因为key重复的话value是覆盖!
Hashtable的key可以为null吗?
- 的初始化容量是11,默认加载因子是:0.75f,Hashtable的扩容是:原容量 * 2 + 1
- Hashtable的key和value都是不能为null的。 Hashtable方法都带有synchronized:线程安全的。
- 线程安全有其它的方案,这个Hashtable对线程的处理导致效率较低,使用较少了。
放在HashMap集合key部分的,以及放在HashSet集合中的元素,需要同时重写hashCode方法和equals方法。
public class HashMapTest02 { public static void main(String[] args) { Student s1 = new Student("zhangsan"); Student s2 = new Student("zhangsan"); // 没有重写equals方法是false //System.out.println(s1.equals(s2)); // false // 重写equals方法之后是true System.out.println(s1.equals(s2)); //true (s1和s2表示相等) //没有重写HashCode,调用的Object中的HashCode比较的是内存地址 System.out.println("s1的hashCode=" + s1.hashCode()); //284720968 (重写hashCode之后-1432604525) System.out.println("s2的hashCode=" + s2.hashCode()); //122883338 (重写hashCode之后-1432604525) // s1.equals(s2)结果已经是true了,表示s1和s2是一样的,相同的,那么往HashSet集合中放的话, // 按说只能放进去1个。(HashSet集合特点:无序不可重复) Set<Student> students = new HashSet<>(); students.add(s1); students.add(s2); System.out.println(students.size()); // 这个结果按说应该是1. 但是结果是2.显然不符合HashSet集合存储特点。怎么办? } }
重写hashCode方法和equals方法之后:
mport java.util.Objects; public class Student { private String name; public Student() { } public Student(String name) { this.name = name; } public String getName() { return name; } public void setName(String name) { this.name = name; } //重写hashCode方法和equals方法 @Override public boolean equals(Object o) { if (this == o) return true; if (o == null || getClass() != o.getClass()) return false; Student student = (Student) o; return Objects.equals(name, student.name); } @Override public int hashCode() { return Objects.hash(name); } }
HashMap数据结构图: