Fork me on GitHub

第18章 集合框架(2)-Set接口

第18章 集合框架(2)-Set接口

Set是Collection子接口,模拟了数学上的集的概念
Set集合存储特点
1.不允许元素重复
2.不会记录元素的先后添加顺序

Set只包含从Collection继承的方法,不过Set无法记住添加的顺序,不允许包含重复的元素,当试图添加两个相同元素进Set集合,添加操作会失败,add()方法返回false
Set判断两个对象是否相等用equals,而不是用===,也就是说两个对象equals比较返回true,Set集合是不会接受新添加的这个对象的。

1.HashSet类

1.1.equals方法和hashCode方法

HashSet是Set接口最常用的实现类,顾名思义,底层采用了哈希表(散列/hash)算法
其实底层也是一个数组,存在的意义是提供查询速度,插入速度也比较快,但是适用于少量数据的插入操作

在HashSet中如何判断两个对象是否相等问题
1.两个对象的equals比较相等,返回true,则说明是相同对象。
2.两个对象的hashCode方法返回值相等。
以上两个条件都要满足才能说明两个对象是相等的

对象的hashCode值决定了在哈希表中的存储位置
而这缺一不可
在往HashSet集合中添加新的对象的时候,先回判断该对象中的hashCode值:
1.不等:直接把该新的对象存储到hashCode指定的位置
2.相等:在继续判断该对象和集合中的对象的equals作比较
2.1.hashCode相同,equals为true,则视为是同一个对象,则保存在哈希表中
2.2.hashCode相同,equals为false,非常麻烦,存储在之前对象同槽位的链表上(拒绝,操作比较麻烦)

对象的hashCode和equals方法的重要性
每一个存储到hash表中的对象,都的提供hashCode和equals方法,用来判断是否是同一个对象
存储在哈希表中的对象,都应该覆盖equals方法和hashCod方法,并且保证equals相等的时候,hashCode也应该相等

1.2.hashSet集合常用方法

常用方法跟Vector类的相似,不再详细描述

2.LinkedHashSet类

之前我们已经学了两个接口
List接口:允许元素重复,记录先后顺序
Set接口:不允许元素重复,不记录先后顺序
但是有第三种需求:不允许元素重复,但是希望能够记录先后添加顺序,这就是LinkedHashSet类。
LinkedHashSet:底层采用哈希表和链表算法
哈希表:用来保证元素唯一性,此时就是HashSet,在哈希表中元素没有先后顺序
链表:来记录元素的先后添加顺序

import java.util.HashSet;
import java.util.LinkedHashSet;
import java.util.Set;

/**
 * 测试LinkedHashSet类记录顺序的功能
 */
public  class TestLinkedHashSet {
    //不记录先后顺序
    public static void HashSetDemo(){
        Set<String> set = new HashSet<>();
        set.add("X");
        set.add("C");
        set.add("B");
        set.add("1");
        set.add("2");
        System.out.println(set);//[1, B, 2, C, X]

    }

    public static void LinkedHashSetDemo(){
        //记录先后顺序
        Set<String> set = new LinkedHashSet<>();
        set.add("X");
        set.add("C");
        set.add("B");
        set.add("1");
        set.add("2");
        System.out.println(set);//[X, C, B, 1, 2]
    }

    public static void main(String[] args) {
        HashSetDemo();
        LinkedHashSetDemo();
    }
}


3.TreeSet类

TreeSet类和Set接口的关系是:
TreeSet继承于NaviageableSet接口(可作范围查询集合),再继承于SortSet接口(可排序的集合),最后再继承Set接口
底层采用红黑树算法,会对存储的元素默认按照使用自然排序(从小到大):
必须保证TreeSet集合中的元素对象是同一种类型的对象。
例下面这个会报错

//编译之后会报错,A和1不是同类型,不能做对比
public class TestTreeSet {
    public static void main(String[] args) {
        TreeSet set = new TreeSet();
        set.add("A");
        set.add(1);
        System.out.println(set);
    }

如果是同类型的是可以的(此处是用泛型作的限定):

import java.util.TreeSet;


public class TestTreeSet {
    public static void main(String[] args) {
        TreeSet set = new TreeSet();
        set.add("A");
        set.add("D");
        set.add("Y");
        set.add("1");
        set.add("6");
        set.add("C");
        System.out.println(set);//[1, 6, A, C, D, Y]

    }
}


关于TreeSet类的一些方法:
除了一些通用的方法,这里再举例一些特殊的用法:

import java.util.TreeSet;

//验证TreeSet的方法
public class TestTreeSet {
    public static void main(String[] args) {
        TreeSet set = new TreeSet();
        set.add("A");
        set.add("D");
        set.add("Y");
        set.add("1");
        set.add("6");
        set.add("C");
        System.out.println(set);//[1, 6, A, C, D, Y]
        //first()返回第一个(最低)元素对象
        System.out.println(set.first());//1
        //last()返回最后面的一个,也就是最大的一个
        System.out.println(set.last());//Y
        //floor(E e)返回所有小于或等于给定的元素中的最大的一个对象
        System.out.println(set.floor("C"));//C
        //lower(E e)返回此 set 中严格小于给定元素的最大元素;如果不存在这样的元素,则返回 null。
        System.out.println(set.lower("1"));//null
        //ceiling(E e) 返回此 set 中大于等于给定元素的最小元素;如果不存在这样的元素,则返回 null。
        System.out.println(set.ceiling("A"));//A
        //tailSet(E fromElement)返回此 set 的部分视图,其元素大于等于 fromElement,其实就是给定元素之后的集合对象
        System.out.println(set.tailSet("A"));//[A, C, D, Y]

    }
}

以上的方法并不是全部,具体的可以查api

3.1.排序接口

TreeSet的排序规则有两种,一种是自然排序,一种是认为设定。这是TreeSet特有的,往TreeSet里存放元素的时候,必须要用compareTo方法,如果是自己写的对象,要在这个对象里面重写这个方法。

3.1.1.Comparable自然排序

自然排序:
TreeSet调用集合元素的compareTo方法来比较元素的大小关系,然后将集合元素按照升序排列(从小到大),要求TreeSet集合中元素得实现java.util.Comparable接口
自然排序是按Unicode编码排序。先排数字,然后大写字母,再小写字母,字符是按照字典顺序的,A,AB,AC,a

java.util.Comparable接口:可比较的
覆盖public int compareTo(Object o)方法,在该方法中编写比较规则。
在该方法中,比较当前对象(this)和参数对象o比较(严格上说比较的是对象中的数据,比如按照对象的年龄排序)。
this > 0;返回正整数.1
this < 0;返回负整数.-1
this == 0;返回0,此时认为两个对象为同一个对象
在TreeSet的自然排序中,认为如果两个对象作比较如果返回的是0,则认为是同一个对象

import java.util.Set;
import java.util.TreeSet;

//测试comparable自然排序方法
class Person implements Comparable<Person>{
    private String name;
    private int age;
    public Person(String name, int age){
        this.name = name;
        this.age = age;
    }

    public String toString(){
        return "Person [name="+ name +", age="+age+"]";
    }
    //编写比较规则
    public int compareTo(Person other){
        if (this.age > other.age){
            return 1;
        }else if (this.age < other.age){
            return -1;
        }else {
            return 0;
        }

    }
}

public class TestTreeSet {
    public static void main(String[] args) {
        //按照Person对象的年龄做自然排序
        Set<Person> set = new TreeSet<>();
        set.add(new Person("Rocco",98));
        set.add(new Person("Eric",32));
        set.add(new Person("Ao",18));
        set.add(new Person("Job",5));
        System.out.println(set);//[Person [name=Job, age=5], Person [name=Ao, age=18], Person [name=Eric, age=32], Person [name=Rocco, age=98]]
    }
}

3.1.2.Compartor定制排序

定制排序可以按照自己的需求来排序,比如下面的例子中是按照名字的长短来排序的。
在TreeSet构造器中传递到java.lang.Comparator对象,并覆盖public int compare(Object o1, Object o2)再编写比较规则

对于TreeSet集合来说,要么使用自然排序,要么使用定制排序。
判断两个对象是否相等的规则
自然排序:comparaTo返回0
定制排序:compare方法返回0

import java.util.Comparator;
import java.util.Set;
import java.util.TreeSet;

/**
 * 测试定制排序方法
 * 按照名字长短进行排序
 */

class Person {
    String name;
    int age;
    public Person(String name, int age){
        this.name = name;
        this.age = age;
    }

    public String toString(){
        return "Person [name="+ name +", age="+age+"]";
    }

}

class NameLengthComparator implements Comparator<Person> {


    @Override
    public int compare(Person o1, Person o2) {
        if (o1.name.length() > o2.name.length()){
            return -1;
        }else if (o1.name.length() < o2.name.length()){
            return 1;
        }else {
            return 0;
        }
    }
}

public class TestTreeSet {
    public static void main(String[] args) {
        
        Set<Person> set2 = new TreeSet<>(new NameLengthComparator());
        set2.add(new Person("Rocco",98));
        set2.add(new Person("Eric",32));
        set2.add(new Person("Ao",18));
        set2.add(new Person("Job",5));
        System.out.println(set2);//[Person [name=Rocco, age=98], Person [name=Eric, age=32], Person [name=Job, age=5], Person [name=Ao, age=18]]
    }
}


4.Set实现性能分析

Set接口的实现类:
共同特点:
1.都不允许元素重复
2.都不是线程安全类
解决方法:Set s = Collections.synchronizedSet(Set对象);

HashSet:
不保证元素的先后添加顺序
底层采用的是哈熙表算法,查询效率极高。
判断两个对喜爱那个是否是否相等的规则:
1.equals比较true
2.hashCode值相同

要求:要求存在哈希中的对象元素都的覆盖equals和HashCode方法
LinkedHashSet
HashSet的子类,底层也采用的是哈希表算法,但是也使用了链表算法来维持元素的先后添加顺序
判断两个对象是否相等的规则和HashSet相同
因为需要多使用一个链表来记录元素的顺序,所以性能相对与HashSet较低
一般少用,如果要求一个集合既要保证元素不重复,又需要记录添加先后顺序,才选择使用LinkedHashSet
TreeSet
不保证元素的先后添加顺序,但是会对集合中的元素做排序操作
底层采用红黑树算法(树结构,比较擅长做范围查询)
TreeSet要么采用自然排序,要么定制排序
自然排序:要求在TreeSet集合中的对象必须实现java.lang.Comparable接口,并覆盖compareTo方法
定制排序:要求在构建TreeSet对象的时候,传入一个比较器对象(必须实现java.lang.Comparator接口)。在比较器中覆盖compare方法,并编写比较规则
TreeSet判断元素对象重复的规则
compareTo/compare方法是否返回0,如果返回0,则视为同一个对象

如何选用
HashSet做等值查询效率高,TreeSet做范围查询效率高
而我们更多的情况都是在做等值查询,在数据库的索引中做范围查询较多,所以数据结构主要用于做索引,用来提高查询效率

posted @ 2016-12-09 15:44  洋葱源码  阅读(305)  评论(0编辑  收藏  举报