Java工具类Collections源码分析
一、概述
Collections
工具类提供了大量针对Collection
和Map
的操作,都为静态(static
)方法,总体可分为四类:
- 排序操作
- 查找、替换操作
- 同步控制
- 设置不可变(只读)集合
二、排序操作
Collections
提供以下方法对List
进行排序操作:
- void reverse(List<?> list):翻转列表顺序。
- void shuffle(List<?> list):随机排序。
- void sort(List
list):按自然排序的升序排序。 - void sort(List
list, Comparator c):定制排序,由 Comparator
控制排序逻辑。 - void swap(List<?> list, int i, int j):交换两个索引位置的元素。
- void rotate(List<?> list, int distance):旋转。当
distance
为正数时,将list
后distance
个元素整体移到前面。当distance
为负数时,将list
的前distance
个元素整体移到后面。
2.1 reverse方法
将list
中的元素顺序翻转过来。实现思路就是将第一个和最后一个交换,第二个和倒数第二个交换,依次类推直到中间两个元素交换完毕。
如果list
实现了RandomAccess
接口或列表比较小,根据索引位置,使用上面的swap
方法进行交换,否则,由于直接根据索引位置定位元素效率比较低,使用一前一后两个listIterator
定位待交换的元素。具体代码为:
public static void reverse(List<?> list) {
int size = list.size();
if (size < REVERSE_THRESHOLD || list instanceof RandomAccess) {
for (int i = 0, mid = size >> 1, j = size - 1; i < mid; i++, j--)
swap(list, i, j);
} else {
ListIterator fwd = list.listIterator();
ListIterator rev = list.listIterator(size);
for (int i = 0, mid = list.size() >> 1; i < mid; i++) {
Object tmp = fwd.next();
fwd.set(rev.previous());
rev.set(tmp);
}
}
}
案例:
public class CollectionsTest {
public static void main(String[] args) {
List<Integer> nums = Arrays.asList(new Integer[] {
8, -3, 2, 9, -2
});
System.out.println(nums);
Collections.reverse(nums);
System.out.println(nums);
}
}
输出:
[8, -3, 2, 9, -2]
[-2, 9, 2, -3, 8]
2.2 shuffle方法
Collections
直接提供了对List
元素洗牌的方法:
public static void shuffle(List<?> list);
public static void shuffle(List<?> list, Random rnd);
实现思路是从后往前遍历列表,逐个给每个位置重新赋值,值从前面的未重新赋值的元素中随机挑选。如果列表实现了RandomAccess
接口,或者列表比较小,直接使用前面swap
方法进行交换,否则,先将列表内容拷贝到一个数组中,洗牌,再拷贝回列表。代码如下:
public static void shuffle(List<?> list, Random rnd) {
int size = list.size();
if (size < SHUFFLE_THRESHOLD || list instanceof RandomAccess) {
for (int i = size; i > 1; i--)
swap(list, i - 1, rnd.nextInt(i));
} else {
Object arr[] = list.toArray();
// Shuffle array
for (int i = size; i > 1; i--)
swap(arr, i - 1, rnd.nextInt(i));
// Dump array back into list
ListIterator it = list.listIterator();
for (int i = 0; i < arr.length; i++) {
it.next();
it.set(arr[i]);
}
}
}
演示:
public class CollectionsTest {
public static void main(String[] args) {
List<Integer> nums = Arrays.asList(new Integer[] {
8, -3, 2, 9, -2
});
System.out.println(nums);
Collections.shuffle(nums);
System.out.println(nums);
}
}
结果:
[8, -3, 2, 9, -2]
[-3, 8, -2, 2, 9]
2.3 rotate方法
public static void rotate(List<?> list, int distance);
distance
表示循环移位个数,一般正数表示向右移,负数表示向左移,比如:
public class CollectionsTest {
public static void main(String[] args) {
List<Integer> list1 = Arrays.asList(new Integer[] {
8, 5, 3, 6, 2
});
Collections.rotate(list1, 2);
System.out.println(list1);
List<Integer> list2 = Arrays.asList(new Integer[] {
8, 5, 3, 6, 2
});
Collections.rotate(list2, -2);
System.out.println(list2);
}
}
输出为:
[6, 2, 8, 5, 3]
[3, 6, 2, 8, 5]
这个方法很有用的一点是,它也可以用于子列表,可以调整子列表内的顺序而不改变其他元素的位置。比如,将第j
个元素向前移动到k (k>j)
,可以这么写:
Collections.rotate(list.subList(j, k + 1), -1);
再举个例子:
public class CollectionsTest {
public static void main(String[] args) {
List<Integer> list = Arrays.asList(new Integer[] {
8, 5, 3, 6, 2, 19, 21
});
Collections.rotate(list.subList(1, 5), 2);
System.out.println(list);
}
}
输出为:
[8, 6, 2, 5, 3, 19, 21]
这个类似于列表内的"剪切"和"粘贴",将子列表[5, 3]"剪切","粘贴"到2后面。如果需要实现类似"剪切"和"粘贴"的功能,可以使用rotate
方法。
循环移位的内部实现比较巧妙,根据列表大小和是否实现了RandomAccess
接口,有两个算法,都比较巧妙,两个算法在《编程珠玑》这本书的2.3节有描述。
篇幅有限,我们只解释下其中的第二个算法,它将循环移位看做是列表的两个子列表进行顺序交换。再来看上面的例子,循环左移2位:
[8, 5, 3, 6, 2] -> [3, 6, 2, 8, 5]
就是将[8, 5]和[3, 6, 2]两个子列表的顺序进行交换。
循环右移两位:
[8, 5, 3, 6, 2] -> [6, 2, 8, 5, 3]
就是将[8, 5, 3]和[6, 2]两个子列表的顺序进行交换。
根据列表长度size
和移位个数distance
,可以计算出两个子列表的分隔点,有了两个子列表后,两个子列表的顺序交换可以通过三次翻转实现,比如有A和B两个子列表,A有m个元素,B有n个元素:
要变为:
可经过三次翻转实现:
- 翻转子列表A
- 翻转子列表B
- 翻转整个列表
这个算法的整体实现代码为:
private static void rotate2(List<?> list, int distance) {
int size = list.size();
if (size == 0)
return;
int mid = -distance % size;
if (mid < 0)
mid += size;
if (mid == 0)
return;
reverse(list.subList(0, mid));
reverse(list.subList(mid, size));
reverse(list);
}
mid
为两个子列表的分割点,调用了三次reverse
以实现子列表顺序交换。
三、查找,替换操作
- int binarySearch(List list, Object key),:对List进行二分查找,返回索引,注意List必须是有序的。
- int max(Collection coll):根据元素的自然顺序,返回最大的元素。类比int min(Collection coll)。
- int max(Collection coll, Comparator c):根据定制排序,返回最大元素,排序规则由Comparator类控制。类比int min(Collection coll, Comparator c)。
- void fill(List list, Object obj):用元素obj填充list中所有元素。nCopies返回不可修改集合。
- int frequency(Collection c, Object o):统计元素出现次数。
- int indexOfSubList(List list, List target):统计target在list中第一次出现的索引,找不到则返回-1,类比int lastIndexOfSubList(List source, list target)。
- boolean replaceAll(List
list, Object oldVal, Object newVal):用新元素替换旧元素。
3.1 binarySearch方法
List
的二分查找的基本思路与Arrays
中的是一样的,但数组可以根据索引直接定位任意元素,实现效率很高,List
就不一定了,我们来看它的实现代码:
public static <T> int binarySearch(List<? extends Comparable<? super T>> list, T key) {
if (list instanceof RandomAccess || list.size() < BINARYSEARCH_THRESHOLD)
return Collections.indexedBinarySearch(list, key);
else
return Collections.iteratorBinarySearch(list, key);
}
分为两种情况,如果List
可以随机访问(如数组),即实现了RandomAccess
接口,或者元素个数比较少,则实现思路与Arrays
一样,调用indexedBinarySearch
根据索引直接访问中间元素进行查找,否则调用iteratorBinarySearch
使用迭代器的方式访问中间元素进行查找。
indexedBinarySearch
的代码为:
private static <T> int indexedBinarySearch(List<? extends Comparable<? super T>> list, T key) {
int low = 0;
int high = list.size() - 1;
while (low <= high) {
int mid = (low + high) >>> 1;
Comparable<? super T> midVal = list.get(mid);
int cmp = midVal.compareTo(key);
if (cmp < 0)
low = mid + 1;
else if (cmp > 0)
high = mid - 1;
else
return mid; // key found
}
return -(low + 1); // key not found
}
调用list.get(mid)
访问中间元素。
iteratorBinarySearch
的代码为:
private static <T> int iteratorBinarySearch(List<? extends Comparable<? super T>> list, T key) {
int low = 0;
int high = list.size() - 1;
ListIterator<? extends Comparable<? super T>> i = list.listIterator();
while (low <= high) {
int mid = (low + high) >>> 1;
Comparable<? super T> midVal = get(i, mid);
int cmp = midVal.compareTo(key);
if (cmp < 0)
low = mid + 1;
else if (cmp > 0)
high = mid - 1;
else
return mid; // key found
}
return -(low + 1); // key not found
}
调用get(i, mid)
寻找中间元素,get
方法的代码为:
private static <T> T get(ListIterator<? extends T> i, int index) {
T obj = null;
int pos = i.nextIndex();
if (pos <= index) {
do {
obj = i.next();
} while (pos++ < index);
} else {
do {
obj = i.previous();
} while (--pos > index);
}
return obj;
}
通过迭代器方法逐个移动到期望的位置。
我们来分析下效率,如果List
支持随机访问,效率为\(O(log2(N))\),如果通过迭代器,比较的次数为\(O(log2(N))\),但遍历移动的次数为\(O(N)\),N为列表长度。
3.2 max方法
Collections
提供了如下查找最大最小值的方法:
public static <T extends Object & Comparable<? super T>> T max(Collection<? extends T> coll);
public static <T> T max(Collection<? extends T> coll, Comparator<? super T> comp);
public static <T extends Object & Comparable<? super T>> T min(Collection<? extends T> coll);
public static <T> T min(Collection<? extends T> coll, Comparator<? super T> comp);
含义和用法都很直接,实现思路也很简单,就是通过迭代器进行比较,比如,其中一个方法的代码为:
public static <T extends Object & Comparable<? super T>> T max(Collection<? extends T> coll) {
Iterator<? extends T> i = coll.iterator();
T candidate = i.next();
while (i.hasNext()) {
T next = i.next();
if (next.compareTo(candidate) > 0)
candidate = next;
}
return candidate;
}
3.3 frequency方法
方法为:
public static int frequency(Collection<?> c, Object o);
返回元素o
在容器c
中出现的次数,o
可以为null
。含义很简单,实现思路也是,就是通过迭代器进行比较计数。
3.4 indexOfSubList方法
对List
接口对象,Collections
提供了类似方法,在source List
中查找target List
的位置:
public static int indexOfSubList(List<?> source, List<?> target);
public static int lastIndexOfSubList(List<?> source, List<?> target);
indexOfSubList
从开头找,lastIndexOfSubList
从结尾找,没找到返回-1
,找到返回第一个匹配元素的索引位置,比如:
public class CollectionsTest {
public static void main(String[] args) {
List<Integer> source = Arrays.asList(new Integer[]{
35, 24, 13, 12, 8, 24, 13, 7, 1
});
System.out.println(Collections.indexOfSubList(source, Arrays.asList(new Integer[]{24, 13})));
System.out.println(Collections.lastIndexOfSubList(source, Arrays.asList(new Integer[]{24, 13})));
}
}
输出为:
1
5
这两个方法的实现都是属于"暴力破解"型的,将target
列表与source
从第一个元素开始的列表逐个元素进行比较,如果不匹配,则与source
从第二个元素开始的列表比较,再不匹配,与source
从第三个元素开始的列表比较,依次类推。
3.5 replaceAll方法
替换方法为:
public static <T> boolean replaceAll(List<T> list, T oldVal, T newVal);
将List
中的所有oldVal
替换为newVal
,如果发生了替换,返回值为true
,否则为false
。
四、同步控制
Collections
中几乎对每个集合都定义了同步控制方法,例如SynchronizedList()
,SynchronizedMap()
等方法,来将集合包装成线程安全的集合。下面是Collections
将普通集合包装成线程安全集合的用法,
public class SynchronizedTest {
public static void main(String[] args) {
Collection<String> collection = Collections.synchronizedCollection(new ArrayList<>());
List<String> list = Collections.synchronizedList(new ArrayList<>());
Set<String> set = Collections.synchronizedSet(new HashSet<>());
Map<String, String> map = Collections.synchronizedMap(new HashMap<>());
}
}
4.1 synchronizedMap方法
Collections.synchronizedMap
静态调用如下:
public static <K,V> Map<K,V> synchronizedMap(Map<K,V> m) {
return new SynchronizedMap<>(m);
}
在SynchronizedMap
内部维护了一个普通对象Map
,还有排斥锁mutex
。
private static class SynchronizedMap<K,V>
implements Map<K,V>, Serializable {
private final Map<K, V> m; // Backing Map
final Object mutex; // Object on which to synchronize
SynchronizedMap(Map<K, V> m) {
this.m = Objects.requireNonNull(m);
mutex = this;
}
SynchronizedMap(Map<K, V> m, Object mutex) {
this.m = m;
this.mutex = mutex;
}
public V put(K key, V value) {
synchronized (mutex) {
return m.put(key, value);
}
}
//...
}
我们在调用这个方法的时候就需要传入一个Map
,可以看到有两个构造器,如果你传入了mutex
参数,则将对象排斥锁赋值为传入的对象。
如果没有,则将对象排斥锁赋值为this
,即调用synchronizedMap
的对象,就是上面的Map
。创建出synchronizedMap
之后,再操作map
的时候,就会对方法上锁。
五、设置不可变(只读)集合
Collections
提供了三类方法返回一个不可变集合,
- emptyXXX():返回一个空的只读集合。
- singleXXX():返回一个只包含指定对象,只有一个元素,只读的集合。
- unmodifiableXXX():返回指定集合对象的只读视图。
用法如下:
public class UnmodifiableCollection {
public static void main(String[] args) {
List<Integer> list = Collections.emptyList();
Set<String> set = Collections.singleton("avs");
Map<String, Integer> map = new HashMap<>();
map.put("a", 100);
map.put("b", 200);
map.put("c", 150);
Map<String, Integer> readOnlyMap = Collections.unmodifiableMap(map);
//下面会报错
list.add(100);
set.add("sdf");
map.put("d", 300);
}
}
执行结果:
Exception in thread "main" java.lang.UnsupportedOperationException
at java.util.AbstractList.add(Unknown Source)
at java.util.AbstractList.add(Unknown Source)
at collection.collections.UnmodifiableCollection.main(UnmodifiableCollection.java:22)
5.1 emptyList方法
emptyList
返回的是一个静态不可变对象,它可以节省创建新对象的内存和时间开销。我们来看下emptyList
的具体定义:
public static final <T> List<T> emptyList() {
return (List<T>) EMPTY_LIST;
}
EMPTY_LIST
的定义为:
public static final List EMPTY_LIST = new EmptyList<>();
是一个静态不可变对象,类型为EmptyList
,它是一个私有静态内部类,继承自AbstractList
,主要代码为:
private static class EmptyList<E>
extends AbstractList<E>
implements RandomAccess {
public Iterator<E> iterator() {
return emptyIterator();
}
public ListIterator<E> listIterator() {
return emptyListIterator();
}
public int size() {return 0;}
public boolean isEmpty() {return true;}
public boolean contains(Object obj) {return false;}
public boolean containsAll(Collection<?> c) { return c.isEmpty(); }
public Object[] toArray() { return new Object[0]; }
public <T> T[] toArray(T[] a) {
if (a.length > 0)
a[0] = null;
return a;
}
public E get(int index) {
throw new IndexOutOfBoundsException("Index: "+index);
}
public boolean equals(Object o) {
return (o instanceof List) && ((List<?>)o).isEmpty();
}
public int hashCode() { return 1; }
}
如果返回值只是用于读取,可以使用emptyList
方法,但如果返回值还用于写入,则需要新建一个对象。
六、其他
- disjoint(Collection c1, Collection c2):如果两个指定
collection
中没有相同的元素,则返回true
。 - addAll(Collection<? super T> c, T... a):一种方便的方式,将所有指定元素添加到指定collection中。示范:Collections.addAll(flavors, "Peaches 'n Plutonium", "Rocky Racoon");
- Comparator
reverseOrder(Comparator cmp):返回一个比较器,它强行反转指定比较器的顺序。如果指定比较器为null,则此方法等同于reverseOrder()(换句话说,它返回一个比较器,该比较器将强行反转实现Comparable接口那些对象collection上的自然顺序)。
import java.util.Collection;
import java.util.Collections;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Set;
public class OtherCollection {
public static void main(String[] args) {
List<String> list1 = new ArrayList<String>();
List<String> list2 = new ArrayList<String>();
// addAll增加变长参数
Collections.addAll(list1, "大家好", "你好", "我也好");
Collections.addAll(list2, "大家好", "a李四", "我也好");
// disjoint检查两个Collection是否的交集
boolean b1 = Collections.disjoint(list, list1);
boolean b2 = Collections.disjoint(list, list2);
System.out.println(b1 + "\t" + b2);
// 利用reverseOrder倒序
Collections.sort(list1, Collections.reverseOrder());
System.out.println(list1);
}
}
输出
true false
[我也好, 大家好, 你好]
6.1 disjoint方法
方法为:
public static boolean disjoint(Collection<?> c1, Collection<?> c2);
如果c1
和c2
有交集,返回值为false
,没有交集,返回值为true
。
实现原理也很简单,遍历其中一个容器,对每个元素,在另一个容器里通过contains
方法检查是否包含该元素,如果包含,返回false
,如果最后不包含任何元素返回true
。这个方法的代码会根据容器是否为Set
以及集合大小进行性能优化,即选择哪个容器进行遍历,哪个容器进行检查,以减少总的比较次数,具体我们就不介绍了。