Java8新特性(二)——强大的Stream API
一、强大的Stream API
除了Lambda表达式外,Java8另外一项重大更新便是位于java.util.stream.*下的Stream API
Stream 是 Java8 中处理集合的关键抽象概念,它可以指定你希望对 集合进行的操作,可以执行非常复杂的查找、过滤和映射数据等操作。 使用Stream API 对集合数据进行操作,就类似于使用 SQL 执行的数 据库查询。也可以使用 Stream API 来并行执行操作。简而言之, Stream API 提供了一种高效且易于使用的处理数据的方式。
什么是Stream
是数据渠道,用于操作数据源(集合、数组等)所生成的元素序列。 “集合讲的是数据,流讲的是计算!
注意:
①Stream 自己不会存储元素。
②Stream 不会改变源对象。相反,他们会返回一个持有结果的新Stream。
③Stream 操作是延迟执行的。这意味着他们会等到需要结果的时候才执行。
接下来从三个流程讲解Stream的用法:创建——中间操作——终止操作
如何创建Stream
通过Collection集合家族的方法创建流
default Stream stream() : 返回一个顺序流
default Stream parallelStream() : 返回一个并行流
通过数组的静态方法(Arrays.stream())
static Stream stream(T[] array): 返回一个流
通过Stream的静态方法of()
public static Stream of(T... values) : 返回一个流
通过静态方法 Stream.iterate() 和 Stream.generate(), 创建无限流。
迭代:public static Stream iterate(final T seed, final UnaryOperator f)
生成: public static Stream generate(Supplier s) :
对以上这些方式进行实例演示:
@Test
public void test1() {
// 1.通过集合得到流
List<String> list = new ArrayList<>();
Stream<String> stream = list.stream();
// 2.通过数组
Employee[] emps = new Employee[5];
Stream<Employee> stream1 = Arrays.stream(emps);
// 3.通过Stream的静态方法
Stream<String> stream2 = Stream.of("a", "b", "c");
// 4.通过Stream静态方法创建无限流
Stream<Integer> stream3 = Stream.iterate(0, (x) -> x + 2);
Stream<Double> stream4 = Stream.generate(Math::random);
}
中间操作
多个中间操作可以连接起来形成一个流水线,除非流水 线上触发终止操作,否则中间操作不会执行任何的处理! 而在终止操作时一次性全部处理,称为“惰性求值”。
大致可以分为:筛选与切片、映射、排序
我们依旧i通过示例来了解这几个操作:(结果已经通过测试,不再赘述)
// filter——通过Lambda表达式排除流中某些元素
@Test
public void test2() {
List<Employee> empList = new ArrayList<>();
empList.add(new Employee("小张", 18));
empList.add(new Employee("小明", 19));
empList.add(new Employee("小红", 20));
// 集合创建流
Stream<Employee> empStream = empList.stream().filter((e) -> e.getAge() > 18);
// 终止操作
empStream.forEach(System.out::println);
}
// limit——截断流,使流不超过指定数量(与skip互补,暂不演示)
@Test
public void test3() {
List<Employee> empList = new ArrayList<>();
empList.add(new Employee("小张", 18));
empList.add(new Employee("小明", 19));
empList.add(new Employee("小红", 20));
// 注意这种写法
empList.stream().filter((e) -> e.getAge() < 20)
.limit(1)
.forEach(System.out::println);
}
// distinct——通过hashCode()和equals()实现去重
@Test
public void test4() {
List<Employee> empList = new ArrayList<>();
empList.add(new Employee("小张", 18));
empList.add(new Employee("小张", 18));
empList.add(new Employee("小红", 20));
// 去重操作
empList.stream()
.filter((e) -> e.getAge() < 19)
.distinct()
.forEach(System.out::println);
}
映射
示例讲解:
// map——接收函数,将每个元素运用到函数上,映射为一个新的元素(flatMap见定义,不再赘述)
@Test
public void test5() {
List<Employee> empList = new ArrayList<>();
empList.add(new Employee("小张", 18));
empList.add(new Employee("小明", 19));
empList.add(new Employee("小红", 20));
// 映射操作,例如提取名字
empList.stream()
.map(Employee::getName)
.forEach(System.out::println);
}
排序
示例讲解
// sorted——可以按自然排序(无参)或相应的比较器排序(参数为比较器)
@Test
public void test6() {
List<Employee> empList = new ArrayList<>();
empList.add(new Employee("小明", 18));
empList.add(new Employee("小张", 19));
empList.add(new Employee("小红", 20));
// 注意Employee没有自然排序方式!
empList.stream()
.sorted((e1, e2) -> {
// 若年龄相等,比较姓名
if (e1.getAge().equals(e2.getAge())) {
return e1.getName().compareTo(e2.getName());
}
// 年龄不等,直接比较年龄(加上符号,逆向排序)
return -(e1.getAge().compareTo(e2.getAge()));
})
.forEach(System.out::println);
}
终止操作
查找与匹配
// allMatch——检查是否全部匹配
// anyMatch——是否至少匹配一个
// noneMatch不再赘述
@Test
public void test7() {
List<Employee> empList = new ArrayList<>();
empList.add(new Employee("小明", 18, Status.FREE));
empList.add(new Employee("小张", 19, Status.VOCATION));
empList.add(new Employee("小红", 20, Status.FREE));
// 注意Employee没有自然排序方式!
boolean b1 = empList.stream()
.allMatch((e) -> e.getStatus().equals(Status.FREE));
System.out.println(b1);// false
boolean b2 = empList.stream()
.anyMatch((e) -> e.getStatus().equals(Status.VOCATION));
System.out.println(b2);// true
}
// findFirst——流中第一个元素
// findAny——返回任意元素
@Test
public void test8() {
List<Employee> empList = new ArrayList<>();
empList.add(new Employee("小明", 18, Status.FREE));
empList.add(new Employee("小张", 19, Status.VOCATION));
empList.add(new Employee("小红", 20, Status.FREE));
// 注意Employee没有自然排序方式!
Optional<Employee> op = empList.stream()
.sorted((e1, e2) -> e1.getAge().compareTo(e2.getAge()))
.findFirst();
// Java8中使用Optional来避免空指针,orElse表示若op元素为空,则使用另外元素替代
// op.orElse(new Employee("老王", 20, Status.FREE));
Employee employee = op.get();
System.out.println(employee);
Optional<Employee> any = empList.stream()
.filter((e) -> e.getStatus().equals(Status.FREE))
.findAny();
}
// count、max、min有点类似SQL语句
@Test
public void test9() {
List<Employee> empList = new ArrayList<>();
empList.add(new Employee("小明", 18, Status.FREE));
empList.add(new Employee("小张", 19, Status.VOCATION));
empList.add(new Employee("小红", 20, Status.FREE));
// 这里省略了中间操作
long count = empList.stream()
.count();
Optional<Employee> max = empList.stream()
.max((e1, e2) -> {
if (e1.getAge().equals(e2.getAge())) {
return e1.getName().compareTo(e2.getName());
}
return e1.getAge().compareTo(e2.getAge());
});
Employee employee = max.get();
System.out.println(employee);
// 提取最小的工资数(结合之前的中间操作)
Optional<Integer> min = empList.stream()
.map(Employee::getAge)
.min(Integer::compare);
System.out.println(min.get());
}
// forEach之前已经使用到,不再赘述
规约
示例:
// reduce——将集合中的元素反复结合起来,得到一个值
@Test
public void test10() {
List<Employee> empList = new ArrayList<>();
empList.add(new Employee("小张", 18));
empList.add(new Employee("小明", 19));
empList.add(new Employee("小红", 20));
// 例如,计算所有年龄总和(先将员工信息进行映射,提取age,也就是经典的map-reduce模式)
Integer totalAge = empList.stream()
.map(Employee::getAge)
.reduce(0, (x, y) -> x + y);// 第一个参数是起始值,第二个参数为二元运算的Function
System.out.println(totalAge);
}
收集
Collector 接口中方法的实现决定了如何对流执行收集操作(如收 集到 List、Set、Map)。但是 Collectors 实用类提供了很多静态 方法,可以方便地创建常见收集器实例,
示例
// collect——常见的运用例如提取员工信息中的name,组装成新的集合等操作
@Test
public void test11() {
List<Employee> empList = new ArrayList<>();
empList.add(new Employee("小张", 18));
empList.add(new Employee("小明", 19));
empList.add(new Employee("小红", 20));
List<String> list = empList.stream()
.map(Employee::getName)
.collect(Collectors.toList());// 需要去重,请使用toSet();
list.forEach(System.out::println);
// 需要自定义集合,例如LinedHashSet,可以使用此方式
empList.stream()
.map(Employee::getName)
.collect(Collectors.toCollection(HashSet::new));
}
更多Collectors中的方法(例如couonting,grouping),可以参见下表或者在源码中参考
toList List<T> 把流中元素收集到List List<Employee> emps= list.stream().collect(Collectors.toList()); toSet Set<T> 把流中元素收集到Set Set<Employee> emps= list.stream().collect(Collectors.toSet()); toCollection Collection<T> 把流中元素收集到创建的集合 Collection<Employee>emps=list.stream().collect(Collectors.toCollection(ArrayList::new)); counting Long 计算流中元素的个数 long count = list.stream().collect(Collectors.counting()); summingInt Integer 对流中元素的整数属性求和 inttotal=list.stream().collect(Collectors.summingInt(Employee::getSalary)); averagingInt Double 计算流中元素Integer属性的平均 值 doubleavg= list.stream().collect(Collectors.averagingInt(Employee::getSalary)); summarizingInt IntSummaryStatistics 收集流中Integer属性的统计值。 如:平均值 IntSummaryStatisticsiss= list.stream().collect(Collectors.summarizingInt(Employee::getSalary)); joining String 连接流中每个字符串 String str= list.stream().map(Employee::getName).collect(Collectors.joining()); maxBy Optional<T> 根据比较器选择最大值 Optional<Emp>max= list.stream().collect(Collectors.maxBy(comparingInt(Employee::getSalary))); minBy Optional<T> 根据比较器选择最小值 Optional<Emp> min = list.stream().collect(Collectors.minBy(comparingInt(Employee::getSalary))); reducing 归约产生的类型 从一个作为累加器的初始值 开始,利用BinaryOperator与 流中元素逐个结合,从而归 约成单个值 inttotal=list.stream().collect(Collectors.reducing(0, Employee::getSalar, Integer::sum)); collectingAndThen 转换函数返回的类型 包裹另一个收集器,对其结 果转换函数 inthow= list.stream().collect(Collectors.collectingAndThen(Collectors.toList(), List::size)); groupingBy Map<K, List<T>> 根据某属性值对流分组,属 性为K,结果为V Map<Emp.Status, List<Emp>> map= list.stream() .collect(Collectors.groupingBy(Employee::getStatus)); partitioningBy Map<Boolean, List<T>> 根据true或false进行分区 Map<Boolean,List<Emp>>vd= list.stream().collect(Collectors.partitioningBy(Employee::getManage));
二、并行流与串行流
并行流就是把一个内容分成多个数据块,并用不同的线程分 别处理每个数据块的流。
原理——fork/join框架
采用 “工作窃取”模式(work-stealing): 当执行新的任务时它可以将其拆分分成更小的任务执行,并将小任务加到线 程队列中,然后再从一个随机线程的队列中偷一个并把它放在自己的队列中。
更多fork/join相关的介绍,请参见:http://www.infoq.com/cn/articles/fork-join-introduction
Stream API 可以声明性地通过 parallel() 与 sequential() 在并行流与顺序流之间进行切换。
Long sum = LongStream.rangeClosed(0L, 10000000000L)
.parallel()
.sum();
完整的示例,请参见如下:
package com.atguigu.java8; import java.util.concurrent.ForkJoinPool; import java.util.concurrent.ForkJoinTask; import java.util.stream.LongStream; import org.junit.Test; public class TestForkJoin { @Test public void test1(){ long start = System.currentTimeMillis(); ForkJoinPool pool = new ForkJoinPool(); ForkJoinTask<Long> task = new ForkJoinCalculate(0L, 10000000000L); long sum = pool.invoke(task); System.out.println(sum); long end = System.currentTimeMillis(); System.out.println("耗费的时间为: " + (end - start)); //112-1953-1988-2654-2647-20663-113808 } @Test public void test2(){ long start = System.currentTimeMillis(); long sum = 0L; for (long i = 0L; i <= 10000000000L; i++) { sum += i; } System.out.println(sum); long end = System.currentTimeMillis(); System.out.println("耗费的时间为: " + (end - start)); //34-3174-3132-4227-4223-31583 } @Test public void test3(){ long start = System.currentTimeMillis(); Long sum = LongStream.rangeClosed(0L, 10000000000L) .parallel() .sum(); System.out.println(sum); long end = System.currentTimeMillis(); System.out.println("耗费的时间为: " + (end - start)); //2061-2053-2086-18926 } }