java Set(集合)
set不保存重复的元素(至于如何判断元素相同则较为复杂,后面将会看到).Set中最常被使用的是测试归属表,你可以很容易地询问某个对象是否在某个Set中,正因如此,查找就成了Set最重要的操作,因此通常会选择一个HashSet的实现,它专门对快速查找进行了优化.
set具有与Collection完全一样的接口,因此没有额外的功能,实际上set就是Collection,只是行为不同.(这是继承与多态思想的典型应用:表现不同的行为.)Set是基于对象的值来确定归属性的,
通用set类型: HashSet LinkedHashSet
java Set类
package java.util; public interface Set<E> extends Collection<E> { int size(); //输出集合大小 boolean isEmpty(); //判空 boolean contains(Object o);//检查集合中是否包含对象o Iterator<E> iterator(); //迭代器 Object[] toArray(); <T> T[] toArray(T[] a); boolean add(E e); //添加一个元素e boolean remove(Object o); //移除对象o boolean containsAll(Collection<?> c); //检查集合中是否包含集合C的所有元素 boolean addAll(Collection<? extends E> c); //添加集合c的所有元素 boolean retainAll(Collection<?> c); //保留本集合和集合c的差集 boolean removeAll(Collection<?> c); //移除集合中和集合c相同的元素 void clear(); //清除所有element boolean equals(Object o); //当hashCode()方法返回的哈希码有重复时,调用Object方法 int hashCode(); //添加元素时,首先调用本方法返回哈希码,如果没重复则添加到集合,否则调用equals()方法返回的哈希码有重复时 //哈希算法也称为散列算法,是将数据依特定算法直接指定到一个地址上 @Override default Spliterator<E> spliterator() { //splitable iterator可分割迭代器 return Spliterators.spliterator(this, Spliterator.DISTINCT); } }
HashSet示例
//一个HashSet的示例
//: holding/SetOfInteger.java package object; import java.util.*; public class SetOfInteger { public static void main(String[] args) { Random rand = new Random(new Date().getTime()); Set<Integer> intset = new HashSet<Integer>(); for(int i = 0; i < 10000; i++) intset.add(rand.nextInt(30)); System.out.println(intset);//0~29之间的数出现了10000次但每一个数只有一个出现在结果中 } } /* Output: [15, 8, 23, 16, 7, 22, 9, 21, 6, 1, 29, 14, 24, 4, 19, 26, 11, 18, 3, 12, 27, 17, 2, 13, 28, 20, 25, 10, 5, 0] *///:~
由于出于速度的原因HashSet使用了散列.HashSet的维护与TreeSet或LinkedSet都不同,因为它们的实现具有不同的元素存储方式,TreeSet将元素存储在红--黑树数据结构中,而HashSet使用了散列函数,LinkedSet出于速度原因也使用了散列,但看起来它使用了链表来维护元素的插入顺序
用HashSet一般没有规律可循,如果相对结果排序可以使用TreeSet代替HashSet
能产生每个元素都唯一的列表是相当有用的功能,例如,要找出SetOperatoration.java文件中所有的单词的时候,通过编程思想的net.mindview.TextFile工具,可以打开一个文件,并将其放入Set中:
//: holding/UniqueWords.java package object; import java.util.*; //import net.mindview.util.*; public class UniqueWords { public static void main(String[] args) { Set<String> words = new TreeSet<String>( new TextFile("src/object/SetOperations.java", "\\W+"));//"\\W+"为正则表达式,表示"一个或多个字母"
//TreeSet是按字典排序的,因此大小字母和小写字母被放到了不同的组中
System.out.println(words); } } /* Output: [A, B, C, Collections, D, E, F, G, H, HashSet, I, J, K, L, M, N, Output, Print, Set, SetOperations, String, X, Y, Z, add, addAll, added, args, class, contains, containsAll, false, from, holding, import, in, java, main, mindview, net, new, print, public, remove, removeAll, removed, set1, set2, split, static, to, true, util, void] *///:~
如果想按照字母顺序排序,那么可以向TreeSet的构造其中传入String.CASE_INSENTIVE_ORDER比较器(比较器是建立排序顺序的对象)
//: holding/UniqueWordsAlphabetic.java // Producing an alphabetic listing. package object; import java.util.*; //import net.mindview.util.*; public class UniqueWordsAlphabetic { public static void main(String[] args) { Set<String> words = new TreeSet<String>(String.CASE_INSENSITIVE_ORDER);//CASE_INSENSITIVE_ORDER比较器(比较器是建立排序顺序的对象 words.addAll( new TextFile("src/object/SetOperations.java", "\\W+")); System.out.println(words); } } /* Output: [A, add, addAll, added, args, B, C, class, Collections, contains, containsAll, D, E, F, false, from, G, H, HashSet, holding, I, import, in, J, java, K, L, M, main, mindview, N, net, new, Output, Print, public, remove, removeAll, removed, Set, set1, set2, SetOperations, split, static, String, to, true, util, void, X, Y, Z] *///:~