Java数据结构系列(1)——Set接口
1、Set接口介绍
java.util.Set 接口和java.util.List 接口一样,同样继承自Collection 接口,它与Collection 接口中的方法基本一致,并没有对Collection 接口进行功能上的扩充,只是比Collection 接口更加严格了。与List 接口不同的是, Set 接口会以某种规则保证存入的元素不出现重复。
Set 集合有多个子类,这里我们介绍其中的java.util.HashSet 、java.util.LinkedHashSet 这两个集合。
2、HashSet集合介绍
java.util.HashSet 是Set 接口的一个实现类,它所存储的元素是不可重复的,并且元素都是无序的(即存取顺序不一致)。java.util.HashSet 底层的实现其实是一个java.util.HashMap 支持。
HashSet 是根据对象的哈希值来确定元素在集合中的存储位置,因此具有良好的存取和查找性能。保证元素唯一性的方式依赖于: hashCode 与equals 方法。
我们先来使用一下Set集合存储,看下现象,再进行原理的讲解:
public class DemoHashSetString { public static void main(String[] args) { HashSet<String> set=new HashSet<>(); String s1=new String("abc"); String s2=new String("abc"); set.add(s1); set.add(s2); set.add("重地"); set.add("通话"); set.add("abc"); System.out.println(set); } } /* 输出:[重地, 通话, abc] */
2.1、HashSet集合存储数据的结构(哈希表)
什么是哈希表呢?
在JDK1.8之前,哈希表底层采用数组+链表实现,即使用链表处理冲突,同一hash值的链表都存储在一个链表里。但是当位于一个桶中的元素较多,即hash值相等的元素较多时,通过key值依次查找的效率较低。而JDK1.8中,哈希表存储采用数组+链表+红黑树实现,当链表长度超过阈值(8)时,将链表转换为红黑树,这样大大减少了查找时间。
简单的来说,哈希表是由数组+链表+红黑树(JDK1.8增加了红黑树部分)实现的,如下图所示。
看到这张图就有人要问了,这个是怎么存储的呢?
为了方便大家的理解我们结合一个存储流程图来说明一下:
我们以上面的例子为例讲解一下
总而言之,JDK1.8引入红黑树大程度优化了HashMap的性能,那么对于我们来讲保证HashSet集合元素的唯一,其实就是根据对象的hashCode和equals方法来决定的。如果我们往集合中存放自定义的对象,那么保证其唯一,就必须复写hashCode和equals方法建立属于当前对象的比较方式。
2.2、HashSet存储自定义类型元素
给HashSet中存放自定义类型元素时,需要重写对象中的hashCode和equals方法,建立自己的比较方式,才能保证HashSet集合中的对象唯一。
创建自定义Student类
import java.util.Objects; public class Student { private String name; private int age; public Student() { } public Student(String name, int age) { this.name = name; this.age = age; } public String getName() { return name; } public void setName(String name) { this.name = name; } public int getAge() { return age; } public void setAge(int age) { this.age = age; } @Override public boolean equals(Object o){ if(this==o){ return true; } if(o==null&&getClass()==this.getClass()){ return true; } Student student=(Student) o; return Objects.equals(name,student.name) &&age==student.age; } @Override public int hashCode() { return Objects.hash(name,age); } @Override public String toString() { return "Student{" + "name='" + name + '\'' + ", age=" + age + '}'; } }
创建一个实例
import java.util.HashSet; public class HashSetDemo01 { public static void main(String[] args) { HashSet<Student> hashSet=new HashSet<>(); Student s1=new Student("张三",43); hashSet.add(s1); hashSet.add(new Student("李四",45)); hashSet.add(new Student("张三",43)); hashSet.add(new Student("王国武",25)); for (Student student : hashSet) { System.out.println(student); } } } /* 输出: Student{name='张三', age=43} Student{name='李四', age=45} Student{name='王国武', age=25} */
3、LinkedHashSet集合
我们知道HashSet保证元素唯一,可是元素存放进去是没有顺序的,那么我们要保证有序,怎么办呢?
在HashSet下面有一个子类java.util.LinkedHashSet ,它是链表和哈希表组合的一个数据存储结构。
演示代码如下:
import java.util.LinkedList; public class LinkedHashSetDemo { public static void main(String[] args) { LinkedList<String> linkedList=new LinkedList<>(); linkedList.add("bbb"); linkedList.add("aaa"); linkedList.add("ccc"); for (String s : linkedList) { System.out.println(s); } } } /* 输出: bbb aaa ccc */
传送门: