Java基础复习 —— Set 接口及实现类

Set 接口及实现类

Set 接口基本介绍

  1. 无序(添加和取出顺序不一致),没有索引

  2. 不允许重复,所以最多包含一个null

  3. JDK API 中Set 接口实现类

image

Set 接口和常用方法

常用方法

和 List 接口一样,Set 接口也是 Collection 的子接口,因此,常用方法和 Collection 接口一样

Set 接口的遍历方式

同 Collection 接口的遍历方式一样,因为 Set 接口是 Collection 接口的子接口

  1. 使用迭代器
  2. 增强for
  3. 不能使用索引的方式来遍历

Set 接口的实现类 —— HashSet

  1. HashSet 实现了 Set 接口

    image

  2. HashSet 实际上是 HashMap

    public HashSet() {
        map = new HashMap<>();
    }
    
  3. 可以存放 null 值,但只能有一个

  4. HashSet 不保证元素是有序的,顺序取决于 hash 后,再确定索引的结果

  5. 不能有重复元素

HashSet 底层机制说明☆

  • HashSet 的底层是 HashMap,HashMap 的底层是 数组 + 链表 + 红黑树

  • Java中 HashMap 是利用“拉链法”处理 hashcode 的碰撞问题

image

  1. 先获取元素的哈希值hashCode()方法)

  2. 对哈希值进行运算,得出一个索引值即为要存放在哈希表中的位置号

  3. 找到存储数据表 table,如果该位置上没有其他元素,则直接存放

    如果该位置上已经有有其他元素,则要进行equals()方法判断,如果相等,则不再添加,如果不相等,则以链表的方式添加

  4. 在Java 8 中,如果一条链表的元素个数超过 TREEIFY_THRESHOLD(默认为8),并且 table的大小 >= MIN_TREEIFY_CAPACITY(默认为64)就会进行树化(红黑树

public class HashSetSource {
    public static void main(String[] args) {
        HashSet hashSet = new HashSet();
    }
}
  •  public HashSet() {
            map = new HashMap<>();
    }
    
    • public HashMap() {
              this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
      }
      
hashSet.add("java");
  • public boolean add(E e) {
            return map.put(e, PRESENT)==null;
        // Dummy value to associate with an Object in the backing Map 与后置映射中的对象关联的虚拟值 
        // private static final Object PRESENT = new Object();
    }
    
    • public V put(K key, V value) {
              return putVal(hash(key), key, value, false, true);
      }
      
        • static final int hash(Object key) {
                  int h;
                  return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
          }
          
          • public int hashCode() { // 调用了该对象(这里是String)的hashCode()方法
                    int h = hash;
                    if (h == 0 && value.length > 0) {
                        char val[] = value;
            
                        for (int i = 0; i < value.length; i++) {
                            h = 31 * h + val[i];
                        }
                        hash = h;
                    }
                    return h;
            }
            
      • final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                           boolean evict) {
                Node<K,V>[] tab; Node<K,V> p; int n, i; 
                if ((tab = table) == null || (n = tab.length) == 0) // table 是 HashMap 的数组,类型是 Node[]
                    // table 为null 或者 大小=0,第一次扩容到16
                    n = (tab = resize()).length;
        	// 根据key,得到hash,去计算该key应该存放在 table 的哪个索引位置
        	// 并把这个位置的对象,赋给p
            // 判断p是否为null,表示还没有存放元素,就创建一个 Node(key = "java", value=PRESENT)
                if ((p = tab[i = (n - 1) & hash]) == null)
                   
                    tab[i] = newNode(hash, key, value, null);
                else {
                    Node<K,V> e; K k; // 开发技巧,在需要局部变量(辅助变量)的时候,再创建
                    if (p.hash == hash &&
                        ((k = p.key) == key || (key != null && key.equals(k))))
                        // 如果当前索引位置对应的链表第一个元素和准备添加的key的hash值一样,并且
                        //(1)准备加入的key 和 p 指向的Node 结点的 key 是同一个对象
                        // (2) p指向的Node 结点的 key 的euqals() 和准备加入的 可以比较后相同
                        e = p;
                    else if (p instanceof TreeNode) // 判断p是不是一棵红黑树
                        // 如果是一颗红黑树,就调用putTreeVal()进行添加
                        e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
                    else { // 如果table对应的索引位置,已经是一个链表,就使用for循环比较
                        // (1)一次和该链表的每一个元素比较后,都不相同,则加入到该链表的对吼
                        for (int binCount = 0; ; ++binCount) {
                            if ((e = p.next) == null) {
                                p.next = newNode(hash, key, value, null);
                                if (binCount >= TREEIFY_THRESHOLD - 1) // binCount >= 8 - 1 链表长度等于8
                                    treeifyBin(tab, hash); // 树化
                                // 该函数里面进行判断是 table 扩容还是树化
                                // if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY) // <64 resize() // 扩容
                                // else if 树化
                                break;
                            }
                            if (e.hash == hash &&
                                ((k = e.key) == key || (key != null && key.equals(k))))
                                break;
                            p = e;
                        }
                    }
                    if (e != null) { // existing mapping for key
                        V oldValue = e.value;
                        if (!onlyIfAbsent || oldValue == null)
                            e.value = value;
                        afterNodeAccess(e);
                        return oldValue;
                    }
                }
                ++modCount;
                if (++size > threshold) // 当前为 16 * 0.75 = 12
                    resize(); // 扩容
                afterNodeInsertion(evict); // 空方法,HashMap留给子类去实现的方法
                return null;
            }
        

扩容和转成红黑树的机制☆☆

  1. HashSet 底层是HashMap,第一次添加时,table 数组扩容到 16,临界值(threshold)= 16 * 加载因子(LoadFactor =0.75)= 12

  2. 如果 table 数组到达临界值 12,就扩容到 16 * 2 = 32,新的临界值就是 32 * 0.75 = 24,以此类推

  3. 在Java 8 中,如果一条链表的元素个数到达 TREEIFY_THRESHOLD(默认为8),并且 table 的大小 >= MIN_TREEIFY_CAPACITY(默认为64),就会进行树化(红黑树),否则仍然采用数组扩容机制

Set 接口实现类 —— LinkedHashSet

LinkedHashSet 的说明

  1. LinkedHashSet 是 HashSet 的子类

image

  1. LinkedHashSet 底层是 LinkedHashMap,底层维护了一个 数组 + 双向链表

    数组 table 存放的结点类型是 LinkedHashMap$Entry

    static class Entry<K,V> extends HashMap.Node<K,V> {
            Entry<K,V> before, after;
            Entry(int hash, K key, V value, Node<K,V> next) {
                super(hash, key, value, next);
            }
    }
    
  2. LinkedHashSet 根据元素的 hashCode 值来确定元素的存储位置,同时使用链表维护元素的次序,这使得元素看起来是以插入顺序保存的

  3. LinkedHashSet 不允许重复元素

    image

    image

public static void main(String[] args) {
        LinkedHashSet linkedHashSet = new LinkedHashSet();

        linkedHashSet.add(new String("AA"));
        linkedHashSet.add(456);
        linkedHashSet.add(456);
        linkedHashSet.add(new Customer("刘", 1001));
        linkedHashSet.add(123);
        linkedHashSet.add(new Customer("张", 1002));
    // ...
}

image

  • LinkedHashSet 底层是LinkedHashMap,而LinkedHashMap 在 HashMap 存储结构的基础上多使用了双向链表记录添加元素的顺序
  • LinkedHashMap 中定义了 Entry 继承了HashMap的Node,底层存储数据时是数组+链表/红黑树(即哈希表结构),在此结构之上还定义了 Entry<K,V> before, after;用来记录添加元素的顺序

Set 接口实现类 —— TreeSet

TreeSet 的特点:

  1. 有序

    TreeSet可以确保集合元素处于排序状态。TreeSet支持两种排序方式,自然排序 和定制排序,其中自然排序为默认的排序方式。向TreeSet中加入的应该是同一个类的对象。

  2. 不重复;key不能为null(总结一点:凡是有Tree的集合,都是有序的,凡是有Set的就是不重复的)

  3. TreeSet 底层调用 TreeMap

  4. 自然排序使用要排序元素的 CompareTo(Object obj)方法来比较元素之间大小关系,然后将元素按照升序排列

    定制排序,应该使用 Comparator 接口,实现 int compare(T o1, T o2)方法。

posted @ 2023-07-06 17:02  墨染启明  阅读(23)  评论(0编辑  收藏  举报