Java中的函数式编程(五)Java集合框架中的高阶函数
写在前面
随着Java 8引入了函数式接口和lambda表达式,Java 8中的集合框架(Java Collections Framework, JCF)也增加相应的接口以适应函数式编程。
本文的目标是带领大家熟悉Java 8中集合框架新增的常用接口,让我们的代码更简洁、更高级。
本文的示例代码可从gitee上获取:https://gitee.com/cnmemset/javafp
Java 8中的集合框架
首先,和大家从整体上了解Java集合框架。
Java集合框架,主要是由两个根接口派生出来的:一个是 Collecton接口,用于存放单个元素;另一个是 Map 接口,主要用于存放键值对。
Java集合框架的接口继承结构如下图:
Java 8中,主要是Collection、List和Map三个接口新增了一些方法,部分常用的新增函数如下表所示:
接口名
|
Java8新加入的方法
|
Collection
|
forEach(), removeIf(), stream(), parallelStream()
|
List
|
replaceAll(), sort()
|
Map
|
forEach(), replaceAll(), compute(), computeIfAbsent(), computeIfPresent(), merge()
|
上述这些函数,它们都包含一个函数式接口类型的参数。这类函数有一个专门的术语:高阶函数(high order function)。
高阶函数(定义):
一个函数,如果它有一个或多个参数是函数类型的,或者它的返回值是函数类型的,那么我们称这个函数为高阶函数。
题外话:
可以发现,这些新增的方法基本都有默认实现(default implementation),这大大减少了具体子类的负担。接口中的默认方法是Java 8的新特性,一个重要的作用就是“接口演化(interface evolution)”。举例说明,假设在Java 8之前,我们有一个类实现了Collection接口:
public class Container implements Collection { ... }
升级到Java 8后,因为Collection中新增了方法 forEach,假设没有默认方法,之前的类 Container 将编译失败。
Collection中的高阶函数
1. forEach
严格来说,forEach方法是定义在接口 Iterable 中的,它的方法签名和默认实现是:
default void forEach(Consumer<? super T> action) { Objects.requireNonNull(action); for (T t : this) { action.accept(t); } }
它的作用是遍历集合中的每一个元素,然后依次对每个元素执行参数 action 指定的动作。参数 action 是一个 Consumer 类型的函数式接口,我们可以通过lambda表达式或方法引用来实现一个 Consumer 。因此,在Java 8或以后的版本中,不要用 for 语句来迭代 Collection 了,不妨使用 forEach 方法。
示例代码如下:
public static void collectionForEach() { Collection<String> list = Arrays.asList("Guangdong", "Zhejiang", "Jiangsu"); // for 语句 for (String s : list) { System.out.println(s); } // forEach 方法 + lambda表达式 list.forEach(s -> System.out.println(s)); // forEach 方法 + 方法引用 list.forEach(System.out::println); }
2. removeIf
removeIf的方法签名为:
default boolean removeIf(Predicate<? super E> filter) { ... }
removeIf的作用是遍历集合中的每一个元素,然后依次对每个元素进行指定的过滤操作。filter 参数是一个 Predicate 类型的函数式接口。
示例代码如下,假定我们要过滤掉以字母 G 开头的省份:
public static void collectionRemoveIf() { List<String> provinces = new ArrayList<>(Arrays.asList("Guangdong", "Jiangsu", "Guangxi", "Jiangxi", "Shandong")); boolean removed = provinces.removeIf(s -> { return s.startsWith("G"); }); System.out.println(removed); System.out.println(provinces); }
上述代码输出为:
true
[Jiangsu, Jiangxi, Shandong]
3. replaceAll
replaceAll的方法签名是:
default void replaceAll(UnaryOperator<E> operator) { ... }
replaceAll方法的作用是对集合中的每个元素执行 operator 指定的计算,并用计算结果替换原来的元素。参数 operator 是类型为 UnaryOperator 的函数式接口,它的参数和返回值类型是相同的。
示例代码如下:将所有的省份的拼音转换为大写字母
public static void listReplaceAll() { List<String> provinces = Arrays.asList("Guangdong", "Jiangsu", "Guangxi", "Jiangxi", "Shandong"); provinces.replaceAll(s -> s.toUpperCase()); System.out.println(provinces); }
上述代码的输出为:
[GUANGDONG, JIANGSU, GUANGXI, JIANGXI, SHANDONG]
4. sort
sort的方法签名如下:
default void sort(Comparator<? super E> c) { ... }
sort方法是根据比较器 c 指定的排序规则,对 List 中的元素进行排序。参数 c 的类型是Comparator,同样是一个函数式接口。
示例代码:
public static void listSort() { List<String> list = Arrays.asList("Guangdong", "Zhejiang", "Jiangsu", "Xizang", "Fujian", "Hunan", "Guangxi"); // 对省份进行排序,首先按照长度排序,如果长度一样,则按照字母顺序排序 list.sort((first, second) -> { int lenDiff = first.length() - second.length(); return lenDiff == 0 ? first.compareTo(second) : lenDiff; }); list.forEach(s -> System.out.println(s)); }
上述代码的输出为:
Hunan
Fujian
Xizang
Guangxi
Jiangsu
Zhejiang
Guangdong
5. stream 和 parallelStream
Stream是Java中函数式编程的重要组成部分,我们会在随后的文章中加以详述。
Map中的高阶函数
1. forEach
和Collection类似,Map中也有forEach方法,它的方法签名和默认实现如下:
default void forEach(BiConsumer<? super K, ? super V> action) { ... }
可以看到,Map的forEach方法的作用是遍历Map中所有的键值对,并执行参数 action 指定的操作。参数 action 的类型是函数式接口 BiConsumer,要求有2个参数,分别代表键值对的key和value。
示例代码:
public static void mapForEach() { Map<String, String> cityMap = new HashMap<>(); cityMap.put("Guangdong", "Guangzhou"); cityMap.put("Zhejiang", "Hangzhou"); cityMap.put("Jiangsu", "Nanjing"); cityMap.forEach((key, value) -> { System.out.println(String.format("%s 的省会是 %s", key, value)); }); }
上述代码的输出为:
Guangdong 的省会是 Guangzhou
Zhejiang 的省会是 Hangzhou
Jiangsu 的省会是 Nanjing
2. replaceAll
Map的replaceAll的方法签名和默认实现如下:
default void replaceAll(BiFunction<? super K, ? super V, ? extends V> function) { ... }
和Collection的replaceAll类似,Map的replaceAll方法对Map中的每个键值对执行 operator 指定的计算,并用计算结果替换原来的value值。注意到参数 function 是一个 BiFunction,意味着需要提供这样的一个函数实现:它需要有2个参数,参数类型分别和键类型(K)和值类型(V)一一对应,并且它还需要返回一个类型为值类型(V)的返回值。
示例代码:
public static void mapReplaceAll() { Map<String, String> cityMap = new HashMap<>(); cityMap.put("Guangdong", "Guangzhou"); cityMap.put("Zhejiang", "Hangzhou"); cityMap.put("Jiangsu", "Nanjing"); // 将省府的拼音转换为大写 cityMap.replaceAll((key, value) -> { return value.toUpperCase(); }); cityMap.forEach((key, value) -> { System.out.println(String.format("%s 的省会大写是 %s", key, value)); }); }
上述代码输出为:
Guangdong 的省会大写是 GUANGZHOU
Zhejiang 的省会大写是 HANGZHOU
Jiangsu 的省会大写是 NANJING
3. compute
compute的方法签名:
default V compute(K key, BiFunction<? super K, ? super V, ? extends V> remappingFunction) { ... }
compute方法的作用是将参数 remappingFunction 的计算结果关联到参数 key 上,但如果计算结果为null,则在Map中删除key的映射。
示例代码如下:
public static void mapCompute() { Map<String, String> cityMap = new HashMap<>(); cityMap.put("Guangdong", "null"); cityMap.put("Zhejiang", "Hangzhou"); cityMap.put("Jiangsu", "null"); // 稍显复杂的语句,先调用 forEach 遍历 cityMap 中的键,然后根据原有的键值对计算新的值 Set keys = new HashSet<>(cityMap.keySet()); keys.forEach(key -> { cityMap.compute(key, (k, v) -> { // 如果是 Guangdong,则返回 Guangzhou if ("Guangdong".equals(k)) { return "Guangzhou"; } // 如果旧的键值对中,值是字符串 "null" ,则返回 null。 // 这意味着 cityMap 会删除对应的key if ("null".equals(v)) { return null; } // 否则,返回原来的 value 值 return v; }); }); cityMap.forEach((key, value) -> { System.out.println(String.format("%s 的省会是 %s", key, value)); }); }
上述代码的输出为:
Guangdong 的省会是 Guangzhou
Zhejiang 的省会是 Hangzhou
注意到,Jiangsu 已经从cityMap中被删除了。
4. computeIfPresent
computeIfPresent的方法签名和默认实现是:
default V computeIfPresent(K key, BiFunction<? super K, ? super V, ? extends V> remappingFunction) { Objects.requireNonNull(remappingFunction); V oldValue; if ((oldValue = get(key)) != null) { V newValue = remappingFunction.apply(key, oldValue); if (newValue != null) { put(key, newValue); return newValue; } else { remove(key); return null; } } else { return null; } }
computeIfPresent 的方法签名和compute一样,作用也和compute类似,但与compute不同的是,只有在Map中存在key并且对应的value非空时,才会调用参数 remappingFunction 指定的计算函数(函数编程特性之惰性求值:只有触发或满足某种条件后,才会执行函数)。如果计算结果为null,则删除key的映射,否则使用该结果替换key原来的映射。
5. computeIfAbsent
computeIfAbsent的方法签名和默认实现是:
default V computeIfAbsent(K key, Function<? super K, ? extends V> mappingFunction) { Objects.requireNonNull(mappingFunction); V v; if ((v = get(key)) == null) { V newValue; if ((newValue = mappingFunction.apply(key)) != null) { put(key, newValue); return newValue; } } return v; }
computeIfAbsent的作用和computeIfPresent 相反,只有在Map中不存在key或对应的value为null时,才调用参数 mappingFunction 指定的计算函数(函数编程特性之惰性求值:只有触发或满足某种条件后,才会执行函数),并且当计算结果非null时,才将计算结果跟key关联。如果计算结果为null,则Map不做任何修改,不会增加新的映射关系。
computeIfAbsent总是会返回操作之后Map中key对应的value,这个value可能是之前已存在的值(如果之前存在的话),也有可能是计算出来的新值。
computeIfAbsent特别适合用来初始化Map。假设这么一个实践场景公司里的员工已经有一个“姓名->年龄”的Map了,我们需要根据它来构建一个“年龄->姓名列表”的新Map,此时,使用 computeIfAbsent 会使得代码简洁而有效:
public static void mapComputeIfAbsent() { Map<String, Integer> staffMap = new HashMap<>(); staffMap.put("Lilei", 24); staffMap.put("Hanmeimei", 22); staffMap.put("Liming", 24); staffMap.put("Jim", 22); staffMap.put("David", 24); Map<Integer, List<String>> staffInvertMap = new HashMap<>(); staffMap.forEach((key, value) -> { // 以年龄为键,构建一个新的Map // 以 22 岁为例: // 如果 staffInvertMap 之前不存在 22 岁对应的映射关系, // 则新建一个 "年龄 -> ArrayList<String>" 的映射,并且把新建的 ArrayList 返回。 // 如果 staffInvertMap 已经存在 22 岁对应的映射关系了,则将已存在的 ArrayList 返回。 List<String> nameList = staffInvertMap.computeIfAbsent(value, age -> { // 对于同一个 age,这句代码只会执行一次 return new ArrayList<>(); }); nameList.add(key); }); System.out.println(staffInvertMap); }
上述代码的输出为:
{22=[Hanmeimei, Jim], 24=[Lilei, David, Liming]}
题外话:
作者特别喜欢computeIfPresent和computeIfAbsent这两个函数,除了它们可以简化我们的代码外,它俩还有一个特性:在ConcurrentHashMap 中,computeIfPresent和computeIfAbsent中的系列操作具备原子性。原子性的含义,欢迎添加公众号,员说,一起讨论。
6. merge
merge的方法签名和默认实现为:
default V merge(K key, V value, BiFunction<? super V, ? super V, ? extends V> remappingFunction) { Objects.requireNonNull(remappingFunction); Objects.requireNonNull(value); V oldValue = get(key); V newValue = (oldValue == null) ? value : remappingFunction.apply(oldValue, value); if(newValue == null) { remove(key); } else { put(key, newValue); } return newValue; }
merge方法的作用是合并key对应的旧值和新值:当Map中不存在key对应的映射或者映射值为null时,则将参数 value 关联到 key 上;否则,将旧值 oldValue 和 参数 value 作为函数 remappingFunction 的两个参数,计算得出一个新值,如果新值不为null,则将新值关联到 key 上,如果新值为null,则删除 key 对应的映射关系。
一个典型的场景是针对某个用户进行备注,如果之前有过备注,则将新的备注信息加到后面,示例代码如下:
public static void mapMerge() { Map<String, String> staffMap = new HashMap<>(); staffMap.put("Lilei", "性别男 "); // 等价于 staffMap.merge("Lilei", "年龄 24", String::concat) // oldValue 即之前添加的值 “性别男 ”,value 即merge函数的第二个参数 “年龄24” staffMap.merge("Lilei", " 年龄24", (oldValue, value) -> oldValue.concat(value)); staffMap.merge("Hanmeimei", "年龄22", String::concat); System.out.println(staffMap); }
上述代码的输出为:
{Lilei=性别男 年龄24, Hanmeimei=年龄22}
结语
Java 8引入了函数式编程,也因此为Java中的集合框架带来了许多新的功能,使得我们能更好的进行函数式编程。
作为一个优秀的Java程序员,要有意识的在实际编码中运用这些新方法,使得我们的代码更简洁更清晰。