Java 17 java.util.HashSet 类源码分析

在绍了 Map 集合的一种典型实现 HashMap之后 ,我们知道,自Java 8起HashMap 是由数组+但链表+红黑树构成,相对于早期版本的 HashMap 实现,新增了红黑树作为底层数据结构,在数据量较大且哈希碰撞较多时,能够极大的增加检索的效率。我们今天在此基础之上,再来介绍由 HashMap 作为底层数据结构实现的一种数据结构——HashSet。

HashSet 定义

HashSet 是一个由 HashMap 实现的集合。元素无序且不能重复。

1 public class HashSet

2 extends AbstractSet

3 implements Set, Cloneable, java.io.Serializable


HashSet

  和前面介绍的大多数集合一样,HashSet 也实现了 Cloneable 接口和 Serializable 接口,分别用来支持克隆以及支持序列化。还实现了 Set 接口,该接口定义了 Set 集合类型的一套规范。

字段属性

//HashSet集合中的内容是通过 HashMap 数据结构来存储的
private transient HashMap<E,Object> map;

//向HashSet中添加数据,数据在上面的 map 结构是作为 key 存在的,而value统一都是 PRESENT
private static final Object PRESENT = new Object();

  第一个定义一个 HashMap,作为实现 HashSet 的数据结构;第二个 PRESENT 对象,因为前面讲过 HashMap 是作为键值对 key-value 进行存储的,而 HashSet 不是键值对,那么选择 HashMap 作为实现,其原理就是存储在 HashSet 中的数据 作为 Map 的 key,而 Map 的value 统一为 PRESENT(下面介绍具体实现时会了解)。

常用构造函数

无参构造

public HashSet() {
   map = new HashMap<>();
}

直接 new 一个 HashMap 对象出来,采用无参的 HashMap 构造函数,使用默认初始容量(16)和加载因子(0.75)。

指定初始容量

public HashSet(int initialCapacity) {
  map = new HashMap<>(initialCapacity);
}

指定初始容量和加载因子

public HashSet(int initialCapacity, float loadFactor) {
  map = new HashMap<>(initialCapacity, loadFactor);
}

构造包含指定集合中的元素

public HashSet(Collection<? extends E> c) {
  map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
  addAll(c);
}

  集合容量很好理解,这里我介绍一下什么是加载因子。在 HashMap 中,能够存储元素的数量就是:总的容量*加载因子 ,新增一个元素时,如果HashMap集合中的元素大于前面公式计算的结果了,那么就必须要进行扩容操作,从时间和空间考虑,加载因子一般都选默认的0.75。

常用方法

本节介绍HashSet中的常用方法。

添加元素

public boolean add(E e) {
  return map.put(e, PRESENT)==null;
}

  通过 map.put() 方法来添加元素,在上一篇博客介绍该方法时,说明了该方法如果新插入的key不存在,则返回null,如果新插入的key存在,则返回原key对应的value值(注意新插入的value会覆盖原value值)。

  也就是说 HashSet 的 add(E e) 方法,会将 e 作为 key,PRESENT 作为 value 插入到 map 集合中,如果 e 不存在,则插入成功返回 true;如果存在,则返回false。

删除元素

public boolean remove(Object o) {
  return map.remove(o)==PRESENT;
}

  调用 HashMap 的remove(Object o) 方法,该方法会首先查找 map 集合中是否存在 o ,如果存在则删除,并返回该值,如果不存在则返回 null。

  也就是说 HashSet 的 remove(Object o) 方法,删除成功返回 true,删除的元素不存在会返回 false。

查找元素

public boolean contains(Object o) {
  return map.containsKey(o);
}

调用 HashMap 的 containsKey(Object o) 方法,找到了返回 true,找不到返回 false。

遍历元素

HashSet<Integer> set = new HashSet<>();
  set.add(1);
  set.add(2);
  //增强for循环 5 for(Integer i : set){
  System.out.println(i);
}
posted @ 2022-03-30 13:54  楼兰胡杨  阅读(93)  评论(0编辑  收藏  举报