JAVA基础之Set接口

个人理解：

　　Set接口是Collection接口的子类，其继承了所有方法，HashSet集合则实现了Set接口，其内部存储数据时依靠哈希表，一个类似数组和链表的结合体。设置空集合时，存在默认的容量和加载因子，再用HashSet对象调用add方法时，其实是先比较其Hash值，若是没有的话，则直接添加到集合中，若有的话，则再equals下比较其内容（因为有可能内容不一样，但是其Hash值一样），若是内容不一样，则在这个地址下添加（链式），若是一样的话，则丢掉。注意就保证了其的唯一性。（以后定义变量时，都需要重写其hashcode和equals方法）至于LinkedHashSet则在HashSet基础上保证了其的有序性（取出和存入顺序一样）。

　　至此在用eclipse进行编写java代码时，在创建了私有属性后，需要将下图里get、set方法（第二行），hashCode和equals(第四行），toString（第五行），及倒数第二行的构造方法点出来（其中构造方法中包括两种：有参和无参的，需要选择好后点两次）

一、Set接口：

1、Set接口介绍：

Set方法和Collection方法基本一致，通过元素的equals方法，来判断是否为重复元素。

2、HashSet集合：

此类实现Set接口，由哈希表支持（实际上是个HashMap集合，是数组和链表的结合体）。HashSet集合不能保证迭代顺序与元素的存储顺序相同。

3、HashSet集合存储数据的结构：

哈希表：

　　哈希表底层，使用的也是数组机制数组中也存放对象，而这些对象往数组中存放时的位置比较特殊，当需要把这些对象给数组中存放时，那么会根据这些对象的特有数据结合相应的算法，计算出这个对象在数组中的位置，然后把这个对象存放在数组中。而这样的数组就称为哈希数组，即就是哈希表。

　　 public HashSet()

　　　　　　构造一个新的空 set，其底层 HashMap 实例的默认初始容量是 16，加载因子是 0.75。

　　　　（当容量到16*0.75时，会再开16个的容量）

　　当向哈希表中存放元素时，需要根据元素的特有数据结合相应的算法，这个算法其实就是Object类中的hashCode方法。

public int hashCode() {
        int h = hash;  //value是定义的字符数组 ，hash开始为0
        if (h == 0 && value.length > 0) {
            char val[] = value;

            for (int i = 0; i < value.length; i++) {
                h = 31 * h + val[i];
            }
            hash = h;
        }
        return h;
    }

　　由于任何对象都是Object类的子类，所以任何对象有拥有这个方法。即就是在给哈希表中存放对象时，会调用对象的hashCode方法，算出对象在表中的存放位置，这里需要注意，如果两个对象hashCode方法算出结果一样，这样现象称为哈希冲突，这时会调用对象的equals方法，比较这两个对象是不是同一个对象，如果equals方法返回的是true，那么就不会把第二个对象存放在哈希表中，如果返回的是false，就会把这个值存放在哈希表中。

可以理解为：

　　当你用HashSet对象调用add方法时，它会去你存入的值的类型的那个类里调用它的HashCode方法，计算该对象内容的hash值；

　　计算完成后就会去容器中找有没有该hash值对应的值，没有的话，则把该元素添加到容器中去。如果有的话，再调用要存入值的类型的类中的equals方法比较内容。如果内容也一样，就丢掉这个值，不存入容器。如果内容不一样，则存入容器。

public int hashCode() {
        final int prime = 31;
        int result = 1;
        result = prime * result + age;
        result = prime * result + ((name == null) ? 0 : name.hashCode());
        return result;
    }
    public boolean equals(Object obj) {
        if (this == obj)
            return true;
        if (obj == null)
            return false;
        if (getClass() != obj.getClass())
            return false;
        Person other = (Person) obj;
        if (age != other.age)
            return false;
        if (name == null) {
            if (other.name != null)
                return false;
        } else if (!name.equals(other.name))
            return false;
        return true;

　　　总结：保证HashSet集合元素的唯一，其实就是根据对象的hashCode和equals方法来决定的。如果我们往集合中存放自定义的对象，那么保证其唯一，就必须复写hashCode和equals方法建立属于当前对象的比较方式。

4、HashSet存储自定义类型元素：

　　给HashSet中存放自定义类型元素时，需要重写对象中的hashCode和equals方法，建立自己的比较方式，才能保证HashSet集合中的对象唯一

5、LinkedHashSet介绍：

　　在HashSet下面有一个子类LinkedHashSet，它是链表和哈希表组合的一个数据存储结构，LinkedHashSet集合保证元素的存入和取出的顺序。

二、判断集合元素唯一的原理：

1、ArrayList的contains方法判断元素是否重复原理：

　　ArrayList的contains方法会使用调用方法时，传入的元素的equals方法依次与集合中的旧元素所比较，从而根据返回的布尔值判断是否有重复元素。此时，当ArrayList存放自定义类型时，由于自定义类型在未重写equals方法前，判断是否重复的依据是地址值，所以如果想根据内容判断是否为重复元素，需要重写元素的equals方法。

2、HashSet的add 、contains等方法判断元素是否重复原理：

　　Set集合不能存放重复元素，其添加方法在添加时会判断是否有重复元素，有重复不添加，没重复则添加。

　　HashSet集合由于是无序的，其判断唯一的依据是元素类型的hashCode与equals方法的返回结果。规则如下：

　　先判断新元素与集合内已经有的旧元素的HashCode值

①、如果不同，说明是不同元素，添加到集合。

②、如果相同，再判断equals比较结果。返回true则相同元素；返回false则不同元素，添加到集合。

　　所以，使用HashSet存储自定义类型，如果没有重写该类的hashCode与equals方法，则判断重复时，使用的是地址值，如果想通过内容比较元素是否相同，需要重写该元素类的hashcode与equals方法。

posted @ 2019-05-29 17:20 壹叶知秋阅读(2641) 评论(0) 编辑收藏举报

刷新页面返回顶部

JAVA基础之Set接口

公告