JAVA基础之Set接口

个人理解:

  Set接口是Collection接口的子类,其继承了所有方法,HashSet集合则实现了Set接口,其内部存储数据时依靠哈希表,一个类似数组和链表的结合体。设置空集合时,存在默认的容量和加载因子,再用HashSet对象调用add方法时,其实是先比较其Hash值,若是没有的话,则直接添加到集合中,若有的话,则再equals下比较其内容(因为有可能内容不一样,但是其Hash值一样),若是内容不一样,则在这个地址下添加(链式),若是一样的话,则丢掉。注意就保证了其的唯一性。(以后定义变量时,都需要重写其hashcode和equals方法)至于LinkedHashSet则在HashSet基础上保证了其的有序性(取出和存入顺序一样)。

  至此在用eclipse进行编写java代码时,在创建了私有属性后,需要将下图里get、set方法(第二行),hashCode和equals(第四行),toString(第五行),及倒数第二行的构造方法点出来(其中构造方法中包括两种:有参和无参的,需要选择好后点两次)

一、Set接口:

1、Set接口介绍:

Set方法和Collection方法基本一致,通过元素的equals方法,来判断是否为重复元素。

2、HashSet集合:

此类实现Set接口,由哈希表支持(实际上是个HashMap集合,是数组和链表的结合体)。HashSet集合不能保证迭代顺序与元素的存储顺序相同。

3、HashSet集合存储数据的结构:

哈希表:

  哈希表底层,使用的也是数组机制数组中也存放对象,而这些对象往数组中存放时的位置比较特殊,当需要把这些对象给数组中存放时,那么会根据这些对象的特有数据结合相应的算法,计算出这个对象在数组中的位置,然后把这个对象存放在数组中。而这样的数组就称为哈希数组,即就是哈希表。

   public HashSet()

      构造一个新的空 set,其底层 HashMap 实例的默认初始容量是 16,加载因子是 0.75。

    (当容量到16*0.75时,会再开16个的容量)

  当向哈希表中存放元素时,需要根据元素的特有数据结合相应的算法,这个算法其实就是Object类中的hashCode方法。

 

public int hashCode() {
        int h = hash;  //value是定义的字符数组 ,hash开始为0
        if (h == 0 && value.length > 0) {
            char val[] = value;

            for (int i = 0; i < value.length; i++) {
                h = 31 * h + val[i];
            }
            hash = h;
        }
        return h;
    }

  由于任何对象都是Object类的子类,所以任何对象有拥有这个方法。即就是在给哈希表中存放对象时,会调用对象的hashCode方法,算出对象在表中的存放位置,这里需要注意,如果两个对象hashCode方法算出结果一样,这样现象称为哈希冲突,这时会调用对象的equals方法,比较这两个对象是不是同一个对象,如果equals方法返回的是true,那么就不会把第二个对象存放在哈希表中,如果返回的是false,就会把这个值存放在哈希表中。

可以理解为:

  当你用HashSet对象调用add方法时,它会去你存入的值的类型的那个类里调用它的HashCode方法,计算该对象内容的hash值;

  计算完成后就会去容器中找有没有该hash值对应的值,没有的话,则把该元素添加到容器中去。如果有的话,再调用要存入值的类型的类中的equals方法比较内容。如果内容也一样,就丢掉这个值,不存入容器。如果内容不一样,则存入容器。

public int hashCode() {
        final int prime = 31;
        int result = 1;
        result = prime * result + age;
        result = prime * result + ((name == null) ? 0 : name.hashCode());
        return result;
    }
    public boolean equals(Object obj) {
        if (this == obj)
            return true;
        if (obj == null)
            return false;
        if (getClass() != obj.getClass())
            return false;
        Person other = (Person) obj;
        if (age != other.age)
            return false;
        if (name == null) {
            if (other.name != null)
                return false;
        } else if (!name.equals(other.name))
            return false;
        return true;

   总结:保证HashSet集合元素的唯一,其实就是根据对象的hashCode和equals方法来决定的。如果我们往集合中存放自定义的对象,那么保证其唯一,就必须复写hashCode和equals方法建立属于当前对象的比较方式。

4、HashSet存储自定义类型元素:

  给HashSet中存放自定义类型元素时,需要重写对象中的hashCode和equals方法,建立自己的比较方式,才能保证HashSet集合中的对象唯一

5、LinkedHashSet介绍:

  在HashSet下面有一个子类LinkedHashSet,它是链表和哈希表组合的一个数据存储结构,LinkedHashSet集合保证元素的存入和取出的顺序。

二、判断集合元素唯一的原理:

1、ArrayList的contains方法判断元素是否重复原理:

  ArrayList的contains方法会使用调用方法时,传入的元素的equals方法依次与集合中的旧元素所比较,从而根据返回的布尔值判断是否有重复元素。此时,当ArrayList存放自定义类型时,由于自定义类型在未重写equals方法前,判断是否重复的依据是地址值,所以如果想根据内容判断是否为重复元素,需要重写元素的equals方法。

2、HashSet的add 、contains等方法判断元素是否重复原理:

  Set集合不能存放重复元素,其添加方法在添加时会判断是否有重复元素,有重复不添加,没重复则添加。

  HashSet集合由于是无序的,其判断唯一的依据是元素类型的hashCode与equals方法的返回结果。规则如下:

  先判断新元素与集合内已经有的旧元素的HashCode值

①、 如果不同,说明是不同元素,添加到集合。

②、如果相同,再判断equals比较结果。返回true则相同元素;返回false则不同元素,添加到集合。

  所以,使用HashSet存储自定义类型,如果没有重写该类的hashCode与equals方法,则判断重复时,使用的是地址值,如果想通过内容比较元素是否相同,需要重写该元素类的hashcode与equals方法。

posted @ 2019-05-29 17:20  壹叶知秋  阅读(2640)  评论(0编辑  收藏  举报