使用Stream处理集合
首先给大家看一段代码,让大家直观感受下 Java7 和 Java8 遍历处理集合的不同
Dish 是一个菜肴对象,calories 属性表示该菜品的卡路里值,name 则是菜品的名称。我们需要过滤出卡路里小于300、然后根据卡路里值升序、接着拿到他们的名称列表并返回
Java7
public static List<String> getLowCaloricDishesNamesInJava7(List<Dish> dishes){
List<Dish> lowCaloricDishes = new ArrayList<>();
for(Dish d: dishes){
if(d.getCalories() < 300){
lowCaloricDishes.add(d);
}
}
List<String> lowCaloricDishesName = new ArrayList<>();
Collections.sort(lowCaloricDishes, new Comparator<Dish>() {
public int compare(Dish d1, Dish d2){
return Integer.compare(d1.getCalories(), d2.getCalories());
}
});
for(Dish d: lowCaloricDishes){
lowCaloricDishesName.add(d.getName());
}
return lowCaloricDishesName;
}
Java8
public static List<String> getLowCaloricDishesNamesInJava8(List<Dish> dishes){
return dishes.stream()
.filter(d -> d.getCalories() < 300)
.sorted(comparing(Dish::getCalories))
.map(Dish::getName)
.collect(toList());
}
如果需要多核并行处理,则只需调用 dishes.parallelStream() 即可
在 Java8 之前,程序员需要通过 2次遍历 + 一次集合排序才能完成的工作,Java8 只需要一个链式调用就可以解决。这就是 Stream 的强大之处
Stream流是什么
流是 Java API 的新成员,允许程序员以声明式的方式处理集合数据,并且支持链式调用、支持并行处理。用流处理的集合数据高效且易读。
流与集合的异同
1.集合的主要功能是以一定的时间和空间复杂度存储和访问元素,而流主要是用于元素计算
2.集合中的元素可以随意添加和删除,而流不能添加和删除元素
3.流的元素是按需计算的,只有当用到时他才会参与计算,而集合中的元素必须提前全都准备好
4.流只能遍历一次
5.集合采用外部迭代,流采用内部迭代。内部迭代意味着 Java 可以替你选择更优的迭代策略和并行处理。而外部迭代如果程序员想着做个更有的迭代/采用并行就相当于“下次一定”😅了
流操作分类
对流的操作可以分为两类:
1.中间操作
可以继续执行下一个流操作的称为中间操作(方法的返回值是 Stream)
除非流水线上执行终端操作,否则中间操作不会执行任何处理。流会对中间操作进行合并、短路等优化
2.终止操作
关闭流的操作称为终止操作
终止操作会从流的流水线生成结果,返回一个非 stream 的任意类型值
使用流
筛选和切片
1.筛选
filter(Predicate<? super T> predicate) 方法可以将流中满足某条件的元素筛选出来。该方法接收一个谓词函数,返回流。比如要选出某个苹果集合中绿色的苹果
List<Apple> appleList = new ArrayList<>();
List<Apple> redAppleList = appleList.stream().filter(a -> "green".equals(a.getColor())).collect(Collectors.toList());
2.去重
distinct() 方法会根据元素的 hashCode() 和 equals() 方法对流中元素进行去重操作
3.截断
limit(n) 方法会返回流的前 n 个元素,对于有序集合List,流会按照添加顺序返回前 n 个元素,而无序集合则不会
4.跳过
skip(n) 方法会跳过流的前 n 个元素,可以通过 skip(m).limit(n) 返回列表中第 m - (m+n) 区间的元素,类似与 mysql 中的 limit m,n
映射
1.对流中的每个元素应用函数
map(Function<? super T, ? extends R> mapper) 方法。该方法接收一个 Function 函数,对流中的每一个元素使用。然后可以返回任意类型的对象。有了该方法,就可以结合 Lambda 表达式对集合中的元素使用函数进行各种转换
2.流的扁平化
flatMap() 可以将流操作中多个流合并成一个流的多个元素。
举个例子:集合 words 有两个单词,现在想获得[H, e, l, o, W, r, d] 在 split 方法执行完毕后,返回的是 Stream(String[]) 对象,而此时如果执行 map 方法,返回的就是多个流的集合(这个例子中就是两个 Stream(String)),这时是无法继续接下来的 distinct 操作的,因此需要 flatMap 将两个 Stream扁平化成一个 Stream,然后进行操作
List<String> words = Arrays.asList("Hello", "World");
List<String> charList = words.stream().map(word -> word.split("")).flatMap(Arrays::stream).distinct().collect(Collectors.toList());
该方法的方法声明 flatMap(Function<? super T, ? extends Stream<? extends R>> mapper) 中可以看出,他所使用的函数式接口 Function 第二个泛型 R 必须是 Stream流。即函数式接口的抽象方法返回值必须是 Stream流及其子类对象。
查找和匹配
1.检查谓词是否至少匹配一个元素
anyMatch 方法可以回答“流中是否存在至少一个复合谓词条件的元素”返回 boolean 类型的值,因此是一个终端操作,例如
List<Integer> num = Arrays.asList(1, 2, 3, 4, 5, 6);
if (num.stream().anyMatch(n -> n % 2 == 0)) {
System.out.println("集合中有元素是2的整数倍");
}
控制台会输出'集合中有元素是2的整数倍',因为集合中 2、4、6都是2的整数倍,符合谓词的条件。
2.检查谓词是否匹配所有元素
allMatch 方法和 anyMatch 方法原理类似,但是它仅当所有元素满足谓词条件时,返回 true。
noneMatch 与 allMatch 正好相反,仅当所有元素不满足谓词条件时,返回 true
ps:和 && || 运算符类似,以上三个操作都用到了短路的思想来提高效率。
3.查找元素
findAny() 该方法返回当前流中的任意元素,可以和其他流操作结合使用,这里需要注意 findAny() 返回的结果被 Optional 所包裹,Optional 是 Java8 为优雅的避免 NPE 所采用的新 API,这里需要说明的就是 Optional.ifPresent(Consumer<? super T> consumer) 表示当 Optional 包裹的元素不为空时,执行 consumer
num.stream().filter(n -> n > 2).findAny().ifPresent(System.out::println);
findFirst() 该方法返回当前流中的第一个元素,一般也和其他流操作(例如 filter() 过滤)结合使用。与 findAny() 不同的是,他一定返回有序集合的第一个满足条件的元素。当然有得必有失,作为代价,findFirst() 在并行处理时限制更多一些。
归约
1.元素求和
reduce(T identity, BinaryOperator
num.stream().reduce(0, (a, b) -> a + b) // 计算完成,返回 21
ps:Lambda 表达式 (a, b) -> a + b) 中 a 是上一轮执行完后的累计值,b 是本次循环流中的元素。通过累加就可以计算出数字的和。
2.最大值和最小值
reduce 方法不仅可以求和、求积。甚至可以计算最大值、最小值。
num.stream().reduce(Integer::max);
num.stream().reduce(Integer::min);
总结
1.流是 Java API 的新成员,允许程序员以声明式的方式处理集合数据,并且支持链式调用、支持并行处理。用流处理的集合数据高效且易读。
2.流的API中可以分为两大类,中间操作和终端操作,中间操作返回流对象,可以链式调用,终端操作则返回非流对象。
3.流提供了很多方便的API,如筛选 filter、去重 distinct、截断 limit、跳过 skip、函数转换 map、扁平化 flatMap、判断流中是否有任意元素符合要求 anyMatch、是否所有元素都符合要求 allMatch、是否所有元素都不符合要求 noneMatch、查找元素 findAny findFirst、累计式的计算元素 reduce