第18章集合框架(2)-Set接口

Set是Collection子接口，模拟了数学上的集的概念
Set集合存储特点
1.不允许元素重复
2.不会记录元素的先后添加顺序

Set只包含从Collection继承的方法，不过Set无法记住添加的顺序，不允许包含重复的元素，当试图添加两个相同元素进Set集合，添加操作会失败，add()方法返回false
Set判断两个对象是否相等用equals，而不是用===，也就是说两个对象equals比较返回true,Set集合是不会接受新添加的这个对象的。

1.HashSet类

1.1.equals方法和hashCode方法

HashSet是Set接口最常用的实现类，顾名思义，底层采用了哈希表(散列/hash)算法
其实底层也是一个数组，存在的意义是提供查询速度，插入速度也比较快，但是适用于少量数据的插入操作

在HashSet中如何判断两个对象是否相等问题
1.两个对象的equals比较相等，返回true，则说明是相同对象。
2.两个对象的hashCode方法返回值相等。
以上两个条件都要满足才能说明两个对象是相等的

对象的hashCode值决定了在哈希表中的存储位置
而这缺一不可
在往HashSet集合中添加新的对象的时候，先回判断该对象中的hashCode值：
1.不等：直接把该新的对象存储到hashCode指定的位置
2.相等：在继续判断该对象和集合中的对象的equals作比较
2.1.hashCode相同，equals为true，则视为是同一个对象，则保存在哈希表中
2.2.hashCode相同，equals为false，非常麻烦，存储在之前对象同槽位的链表上(拒绝，操作比较麻烦)

对象的hashCode和equals方法的重要性
每一个存储到hash表中的对象，都的提供hashCode和equals方法，用来判断是否是同一个对象
存储在哈希表中的对象，都应该覆盖equals方法和hashCod方法，并且保证equals相等的时候，hashCode也应该相等

1.2.hashSet集合常用方法

常用方法跟Vector类的相似，不再详细描述

2.LinkedHashSet类

之前我们已经学了两个接口
List接口：允许元素重复，记录先后顺序
Set接口：不允许元素重复，不记录先后顺序
但是有第三种需求：不允许元素重复，但是希望能够记录先后添加顺序，这就是LinkedHashSet类。
LinkedHashSet：底层采用哈希表和链表算法
哈希表：用来保证元素唯一性，此时就是HashSet，在哈希表中元素没有先后顺序
链表：来记录元素的先后添加顺序

import java.util.HashSet;
import java.util.LinkedHashSet;
import java.util.Set;

/**
 * 测试LinkedHashSet类记录顺序的功能
 */
public  class TestLinkedHashSet {
    //不记录先后顺序
    public static void HashSetDemo(){
        Set<String> set = new HashSet<>();
        set.add("X");
        set.add("C");
        set.add("B");
        set.add("1");
        set.add("2");
        System.out.println(set);//[1, B, 2, C, X]

    }

    public static void LinkedHashSetDemo(){
        //记录先后顺序
        Set<String> set = new LinkedHashSet<>();
        set.add("X");
        set.add("C");
        set.add("B");
        set.add("1");
        set.add("2");
        System.out.println(set);//[X, C, B, 1, 2]
    }

    public static void main(String[] args) {
        HashSetDemo();
        LinkedHashSetDemo();
    }
}

3.TreeSet类

TreeSet类和Set接口的关系是：
TreeSet继承于NaviageableSet接口（可作范围查询集合），再继承于SortSet接口（可排序的集合），最后再继承Set接口
底层采用红黑树算法，会对存储的元素默认按照使用自然排序(从小到大):
必须保证TreeSet集合中的元素对象是同一种类型的对象。
例下面这个会报错

//编译之后会报错，A和1不是同类型，不能做对比
public class TestTreeSet {
    public static void main(String[] args) {
        TreeSet set = new TreeSet();
        set.add("A");
        set.add(1);
        System.out.println(set);
    }

如果是同类型的是可以的(此处是用泛型作的限定)：

import java.util.TreeSet;


public class TestTreeSet {
    public static void main(String[] args) {
        TreeSet set = new TreeSet();
        set.add("A");
        set.add("D");
        set.add("Y");
        set.add("1");
        set.add("6");
        set.add("C");
        System.out.println(set);//[1, 6, A, C, D, Y]

    }
}

关于TreeSet类的一些方法：
除了一些通用的方法，这里再举例一些特殊的用法：

import java.util.TreeSet;

//验证TreeSet的方法
public class TestTreeSet {
    public static void main(String[] args) {
        TreeSet set = new TreeSet();
        set.add("A");
        set.add("D");
        set.add("Y");
        set.add("1");
        set.add("6");
        set.add("C");
        System.out.println(set);//[1, 6, A, C, D, Y]
        //first()返回第一个（最低）元素对象
        System.out.println(set.first());//1
        //last()返回最后面的一个，也就是最大的一个
        System.out.println(set.last());//Y
        //floor(E e)返回所有小于或等于给定的元素中的最大的一个对象
        System.out.println(set.floor("C"));//C
        //lower(E e)返回此 set 中严格小于给定元素的最大元素；如果不存在这样的元素，则返回 null。
        System.out.println(set.lower("1"));//null
        //ceiling(E e) 返回此 set 中大于等于给定元素的最小元素；如果不存在这样的元素，则返回 null。
        System.out.println(set.ceiling("A"));//A
        //tailSet(E fromElement)返回此 set 的部分视图，其元素大于等于 fromElement,其实就是给定元素之后的集合对象
        System.out.println(set.tailSet("A"));//[A, C, D, Y]

    }
}

以上的方法并不是全部，具体的可以查api

3.1.排序接口

TreeSet的排序规则有两种，一种是自然排序，一种是认为设定。这是TreeSet特有的，往TreeSet里存放元素的时候，必须要用compareTo方法，如果是自己写的对象，要在这个对象里面重写这个方法。

3.1.1.Comparable自然排序

自然排序：
TreeSet调用集合元素的compareTo方法来比较元素的大小关系，然后将集合元素按照升序排列(从小到大)，要求TreeSet集合中元素得实现java.util.Comparable接口
自然排序是按Unicode编码排序。先排数字，然后大写字母，再小写字母，字符是按照字典顺序的，A，AB，AC，a

java.util.Comparable接口：可比较的
覆盖public int compareTo(Object o)方法，在该方法中编写比较规则。
在该方法中，比较当前对象(this)和参数对象o比较(严格上说比较的是对象中的数据，比如按照对象的年龄排序)。
this > 0;返回正整数.1
this < 0;返回负整数.-1
this == 0；返回0，此时认为两个对象为同一个对象
在TreeSet的自然排序中，认为如果两个对象作比较如果返回的是0,则认为是同一个对象

import java.util.Set;
import java.util.TreeSet;

//测试comparable自然排序方法
class Person implements Comparable<Person>{
    private String name;
    private int age;
    public Person(String name, int age){
        this.name = name;
        this.age = age;
    }

    public String toString(){
        return "Person [name="+ name +", age="+age+"]";
    }
    //编写比较规则
    public int compareTo(Person other){
        if (this.age > other.age){
            return 1;
        }else if (this.age < other.age){
            return -1;
        }else {
            return 0;
        }

    }
}

public class TestTreeSet {
    public static void main(String[] args) {
        //按照Person对象的年龄做自然排序
        Set<Person> set = new TreeSet<>();
        set.add(new Person("Rocco",98));
        set.add(new Person("Eric",32));
        set.add(new Person("Ao",18));
        set.add(new Person("Job",5));
        System.out.println(set);//[Person [name=Job, age=5], Person [name=Ao, age=18], Person [name=Eric, age=32], Person [name=Rocco, age=98]]
    }
}

3.1.2.Compartor定制排序

定制排序可以按照自己的需求来排序，比如下面的例子中是按照名字的长短来排序的。
在TreeSet构造器中传递到java.lang.Comparator对象，并覆盖public int compare(Object o1, Object o2)再编写比较规则

对于TreeSet集合来说，要么使用自然排序，要么使用定制排序。
判断两个对象是否相等的规则
自然排序：comparaTo返回0
定制排序：compare方法返回0

import java.util.Comparator;
import java.util.Set;
import java.util.TreeSet;

/**
 * 测试定制排序方法
 * 按照名字长短进行排序
 */

class Person {
    String name;
    int age;
    public Person(String name, int age){
        this.name = name;
        this.age = age;
    }

    public String toString(){
        return "Person [name="+ name +", age="+age+"]";
    }

}

class NameLengthComparator implements Comparator<Person> {


    @Override
    public int compare(Person o1, Person o2) {
        if (o1.name.length() > o2.name.length()){
            return -1;
        }else if (o1.name.length() < o2.name.length()){
            return 1;
        }else {
            return 0;
        }
    }
}

public class TestTreeSet {
    public static void main(String[] args) {
        
        Set<Person> set2 = new TreeSet<>(new NameLengthComparator());
        set2.add(new Person("Rocco",98));
        set2.add(new Person("Eric",32));
        set2.add(new Person("Ao",18));
        set2.add(new Person("Job",5));
        System.out.println(set2);//[Person [name=Rocco, age=98], Person [name=Eric, age=32], Person [name=Job, age=5], Person [name=Ao, age=18]]
    }
}

4.Set实现性能分析

Set接口的实现类：
共同特点：
1.都不允许元素重复
2.都不是线程安全类
解决方法：Set s = Collections.synchronizedSet(Set对象);

HashSet：
不保证元素的先后添加顺序
底层采用的是哈熙表算法，查询效率极高。
判断两个对喜爱那个是否是否相等的规则：
1.equals比较true
2.hashCode值相同

要求：要求存在哈希中的对象元素都的覆盖equals和HashCode方法
LinkedHashSet
HashSet的子类，底层也采用的是哈希表算法，但是也使用了链表算法来维持元素的先后添加顺序
判断两个对象是否相等的规则和HashSet相同
因为需要多使用一个链表来记录元素的顺序，所以性能相对与HashSet较低
一般少用，如果要求一个集合既要保证元素不重复，又需要记录添加先后顺序，才选择使用LinkedHashSet
TreeSet
不保证元素的先后添加顺序，但是会对集合中的元素做排序操作
底层采用红黑树算法(树结构，比较擅长做范围查询)
TreeSet要么采用自然排序，要么定制排序
自然排序：要求在TreeSet集合中的对象必须实现java.lang.Comparable接口，并覆盖compareTo方法
定制排序：要求在构建TreeSet对象的时候，传入一个比较器对象(必须实现java.lang.Comparator接口)。在比较器中覆盖compare方法，并编写比较规则
TreeSet判断元素对象重复的规则
compareTo/compare方法是否返回0，如果返回0，则视为同一个对象

如何选用
HashSet做等值查询效率高，TreeSet做范围查询效率高
而我们更多的情况都是在做等值查询，在数据库的索引中做范围查询较多，所以数据结构主要用于做索引，用来提高查询效率

posted @ 2016-12-09 15:44 洋葱源码阅读(319) 评论(0) 收藏举报

刷新页面返回顶部

岑宇

历经苦难而不厌，此乃阿修罗之道！

第18章集合框架(2)-Set接口

第18章集合框架(2)-Set接口

1.HashSet类

1.1.equals方法和hashCode方法

1.2.hashSet集合常用方法

2.LinkedHashSet类

3.TreeSet类

3.1.排序接口

3.1.1.Comparable自然排序

3.1.2.Compartor定制排序

4.Set实现性能分析

公告

岑宇

历经苦难而不厌，此乃阿修罗之道！

第18章 集合框架(2)-Set接口

第18章 集合框架(2)-Set接口

1.HashSet类

1.1.equals方法和hashCode方法

1.2.hashSet集合常用方法

2.LinkedHashSet类

3.TreeSet类

3.1.排序接口

3.1.1.Comparable自然排序

3.1.2.Compartor定制排序

4.Set实现性能分析

公告

第18章集合框架(2)-Set接口

第18章集合框架(2)-Set接口