Java 8 (4) Stream 流 - 使用
在本节中将介绍Stream API支持的许多操作,这些操作可以完成更复杂的数据查询,如筛选、切片、映射、查找、匹配和归约。还有一些特殊的流如:数值流、来自文件和数组等多种来源的流。
筛选和切片
1.用谓词筛选
Streams接口支持filter方法,该操作会接受一个谓词作为参数,并返回一个包含所有符合谓词的元素的流。例如筛选出所有素菜:
List<Dish> vegetarianMenu = menu.stream().filter(Dish::isVegetarian).collect(toList());
2.筛选各异的元素
流海支持一个叫做distinct的方法,它会返回一个元素各异(根据流所生成的元素的hashCode和equals方法的实现)的流。例如筛选所有的偶数并确保没有重复的:
List<Integer> nums = Arrays.asList(1,2,3,13,12,2,1,2,2,1,2,2,3,4,5);
List<Integer> oddNums = nums.stream().filter(s->s%2==0).distinct().collect(toList());
3.截断流
流支持limit(n)方法,该方法会返回一个不超过给定长度的流,所需的长度作为参数传递给limit,如果流是有序的,则最多返回前n个元素。例如筛选热量超过300卡路里的前3道菜:
List<Dish> limit3 = menu.stream().filter(c->c.getCalories()>300).distinct().limit(3).collect(toList());
4.跳过元素
流还支持skip(n)方法,该方法会返回一个扔掉了前n个元素的流,如果流中元素U不足n个,则返回一个空流。例如:跳过超过300卡路里的头两道菜,并返回剩下的。
List<Dish> skip2 = menu.stream().filter(c->c.getCalories()>300).distinct().skip(2).collect(toList());
映射
比如在SQL中,你可以选择从表中选择一列,Stream API也通过map和flatMap方法提供了类似的工具。
1.对流中每一个元素应用函数
流支持map方法,它接受一个函数作为参数。这个函数会被应用到每个元素上,并将其映射成一个新的元素。例如下面把Dish::getName传给了map方法,来提取流中的菜名:
List<String> names = menu.stream().map(Dish::getName).collect(toList());
因为getName返回一个String,所以map方法输出的流的类型就是Stream<String>。例如下面把List<String> 映射为List<Integer> 值是String的长度。
List<String> strs = Arrays.asList("lambda","action","java 8","stream");
List<Integer> ints = strs.stream().map(String::length).collect(toList());
如果要找出每道菜的名称有多长可以再加上一个map:
List<Integer> nameLength = menu.stream().map(Dish::getName).map(String::length).collect(toList());
2.流的扁平化
通过下面这个例子介绍流的扁平化:给定字符串数组:["hello","world"],返回字符数组["h","e","l","o","w","r","d"]。
第1次尝试:你可能觉得很容易,distinct一下就好了
List<String> words = Arrays.asList("hello","world");
List<String[]> collect = words.stream().map(w -> w.split("")).distinct().collect(toList());
但是,传递给map方法的lambda为每个单词返回了一个Stirng[],因此map返回的流实际上是Stream<String[]>类型的,而我们想要的是Stream<String>类型的
第2次尝试:map和Arrays.stream()
首先要活的一个字符流,而不是字符串数组流,有一个叫做Arrays.stream()的方法可以接收一个数组并产生一个流:例如
String[] words = {"hello","world"};
Stream<String> stream = Arrays.stream(words);
使用这个方法应用到前面的流水线里看看
List<Stream<String>> collect1 = words.stream() .map(w -> w.split("")) .map(Arrays::stream) .distinct() .collect(toList());
还是不行,因为现在得到的是一个流的列表List<Stream<String>>。
第3次尝试:使用flatMap
List<String> collect2 = words.stream() .map(w -> w.split("")) .flatMap(Arrays::stream) .distinct() .collect(toList());
使用flatMap的效果是,各个数组并不是分别映射成一个流,而是映射成流的内容。所有使用map(Arrays::stream)时生成的单个流都被合并起来,即扁平化一个流。
映射练习:
1.给定一个数字列表,返回每个数的平方构成的列表:
List<Integer> numbers = Arrays.asList(1,2,3,56,78,9);
List<Integer> collect3 = numbers.stream().map(a -> a * a).collect(toList());
2.给定两个数字列表,返回所有的参数对。
List<Integer> num1 = Arrays.asList(1, 2, 3, 4, 5); List<Integer> num2 = Arrays.asList(1, 2, 3, 4, 5); List<int[]> collect4 = num1.stream() .flatMap(i -> num2.stream().map(j -> new int[]{i, j})) .collect(toList());
3.扩展前一个例子,只返回总和可以被3整除的。
List<int[]> collect5 = num1.stream() .flatMap(i -> num2.stream().filter(j -> (i + j) % 3 == 0).map(j -> new int[]{i, j})) .collect(toList());
查找和匹配
查看数据集中的某些元素是否匹配一个给定的属性,Stream API通过allMatch、anyMatch、noneMatch、findFirst和findAny方法提供了这样的工具
1.至少匹配一个元素 anyMatch
if(menu.stream().anyMatch(m->m.getCalories()>400)){ System.out.println("有卡路里大于400的食物"); }
2.匹配所有元素 allMatch
if(menu.stream().allMatch(Dish::isVegetarian)){ System.out.println("所有菜都是素菜"); }
3.没有匹配 noneMatch
if(menu.stream().noneMatch(m->m.getCalories() < 100)){ System.out.println("所有菜都不小于100卡路里"); }
anyMatch、allMatch、noneMatch这三个操作都用到了短路,就是Java中的 && || 运算符短路在流中的版本。
短路:有些操作不需要处理整个流就可以得到结果。例如一个用and连接起来的大布尔表达式,不管表达式有多长,只要找到一个为false就推断整个表达式为false。
对于流而言,某些操作(allMatch、anyMatch、noneMatch、findFirst、findAny)不用处理整个流就可以得到结果,limit也是一个短路操作。
查找元素
findAndy方法返回当前流中的任意元素:
Optional<Dish> any = menu.stream().filter(Dish::isVegetarian).findAny();
Optional<T>类是一个容器类,代表一个值存在或不存在。例如这个例子,可能会什么都没找到。
isPresent():optional存在值时返回true,否则返回false。
ifPresent(Consumer<T> block)会在值存在的时候执行给定的代码块,(Consumer接口:传递一个T参数,消费这个T 什么也不返回)。
T get():值存在时返回值,否则抛出一个NoSuchElement异常。
T orElse(T other):会在值存在时返回值,否则返回一个默认值。
例如:如果找到了输出这个名字,否则什么也不错
menu.stream().filter(Dish::isVegetarian).findAny().ifPresent(d->System.out.println(d.getName()));
findFrist方法返回第一个元素:
menu.stream().filter(Dish::isVegetarian).findFirst().ifPresent(d->System.out.println(d.getName()));
findFrist和findAny:找到第一个元素在并行上限制更多,如果不关心返回的元素是哪个就是用findAny,因为它在是用并行流时限制较少。
归约 reduce
例如查找所有菜的总卡路里,或菜中最高的卡路里是哪个,这类查询需要将流中所有的元素反复结合起来,得到一个值。这样的查询可以被归类为归约操作。
求和:
在是用reduce方法之前,来看看for-each循环来对数字列表中的元素求和:
List<Integer> nums1 = Arrays.asList(1,2,3,4,5); int sum = 0; for(int i : nums1){ sum +=i; }
是用reduce来求和如下:
int reduceSum = nums1.stream().reduce(0, (a, b) -> a + b);
这里的第一个参数 就如上面设置的初始值一样,第二个参数就是一个BinaryOperator<T>来将两个元素结合起来产生一个新值。
在Java 8 中,Integer类有一个现有的静态sum方法来对两个数求和,因此可以改写成:
Integer reduce = nums1.stream().reduce(0, Integer::sum);
reduce还有一个重载版本,它不用接受初始值,但会返回一个Optional对象:
Optional<Integer> reduce = nums1.stream().reduce(Integer::sum);
最大值和最小值:
Optional<Integer> max = nums1.stream().reduce(Integer::max);
Optional<Integer> min = nums1.stream().reduce(Integer::min);
当然也可以写成 (x,y) -> x< y ? x : y;而不是Integer::min,不过后者更好读。
流操作:无状态和有状态
map或feilter等操作会从输入流中获取每一个元素,并在输出流得到0或1个结果。这些操作一般都是无状态的:他们没有内部状态。
但reduce、sum、max等操作需要内部状态类累计结果,不管流中又多少元素要处理,内部状态都是有界的。
相反,sort或distinct等操作一开始都和filter、map差不多--都是接受一个流,再生成一个流(中间操作),但有一个关键的区别。从流中排序和删除重复项时都需要知道先前的历史,我们把这些操作叫做有状态操作。
到目前学到的流的方法如下:
中间操作:
filter、distinct、skip、limit、map、flatMap、sorted。
终端操作:
anyMatch、noneMatch、allMatch、findAny、findFirst、forEach、collect、reduce、count。
小练习:
public class Trader { private final String name; private final String city; }
public class Transaction { private final Trader trader; private final int year; private final int value; }
Trader raoul = new Trader("Raoul", "Cambridge"); Trader mario = new Trader("Mario","Milan"); Trader alan = new Trader("Alan","Cambridge"); Trader brian = new Trader("Brian","Cambridge"); List<Transaction> transactions = Arrays.asList( new Transaction(brian, 2011, 300), new Transaction(raoul, 2012, 1000), new Transaction(raoul, 2011, 400), new Transaction(mario, 2012, 710), new Transaction(mario, 2012, 700), new Transaction(alan, 2012, 950) );
//1.找出2011年发生的所有交易,并按交易额排序(从低到高) List<Transaction> collect = transactions.stream() .filter(t -> t.getYear() == 2011) .sorted(Comparator.comparing(Transaction::getValue)) .collect(toList()); System.out.println(collect);
//2.交易员都在哪些不同的城市工作过? List<String> collect1 = transactions.stream() .map(m -> m.getTrader().getCity()) .distinct() .collect(toList()); System.out.println(collect1);
//3.查找所有来自于剑桥的交易员,并按姓名排序。 List<Trader> collect2 = transactions.stream() .map(m -> m.getTrader()) .filter(m -> m.getCity() == "Cambridge") .distinct() .sorted(Comparator.comparing(Trader::getName)) .collect(toList());
//4.返回所有交易员的姓名字符串,按字母顺序排序 String reduce = transactions.stream() .map(t -> t.getTrader().getName()) .distinct() .sorted() .reduce("", (n1, n2) -> n1 + n2);//效率不高是stirng 拼接 下一节joining
//5.有没有交易员是在米兰工作的 boolean milan = transactions.stream().anyMatch(c -> c.getTrader().getCity().equals("Milan"));
//6.打印生活在剑桥的交易员的所有交易额 transactions.stream() .filter(t->t.getTrader().getCity().equals("Cambridge")) .map(Transaction::getValue) .forEach(System.out::println);
//7.所有交易中,最高的交易额是多少 Optional<Integer> reduce1 = transactions.stream() .map(Transaction::getValue) .reduce(Integer::max);
//8.找到交易额最小的交易 Optional<Transaction> reduce2 = transactions.stream() .reduce((t1, t2) -> t1.getValue() < t2.getValue() ? t1 : t2);
//流还支持min和max方法 Optional<Transaction> smallTransaction = transactions.stream() .min(Comparator.comparing(Transaction::getValue)); smallTransaction.ifPresent(System.out::println);
数值流
前面使用reduce方法计算了元素的总和,例如:
Integer reduce3 = transactions.stream().map(c -> c.getValue()).reduce(0, Integer::sum);
这段代码的问题是,它有一个暗含的装箱成本,每个Integer都必须拆箱成一个原始类型后再进行求和,要是可以像下面这样直接调用sum方法不是更好?
int sum3 = transactions.stream().map(c->c.getValue()).sum();
这是不可能的,因为map方法会生成一个Stream<T>,虽然流中的元素是Integer类型,但Streams接口没有定义sum方法。Stream API提供了原始类型流特化,专门支持处理数值流的方法。
原始类型流特化
Java 8 引入了三个原始类型特化流接口来解决这个问题:IntStream、DoubleStream、LongStream,分别将流中的元素特化为int、long和double,从而避免了暗含的装箱成本。
1.映射到数值流
将流转换为特化版本的常用方法是mapToInt、mapToDouble和mapToLong,这些方法返回一个特化流,而不是Stream<T>。例如:
int sum = transactions.stream().mapToInt(Transaction::getValue).sum();
mapToInt返回一个IntStream而不是Stream<Integer>,然后就可以调用IntStream中的sum方法,如果流是空的,sum默认返回0.还支持其他方法如max、min、average等。
2.转换回对象流
将特化流转回非特化流,可以使用boxed方法:
IntStream intStream = transactions.stream().mapToInt(Transaction::getValue);
Stream<Integer> stream = intStream.boxed();
3.默认值OptionalInt
Optional对于三中原始流特化,也分别有一个Optional原始类型特化版本:OptionalInt、OptionalDouble、OptionalLong。例如要找到最大元素:
OptionalInt max = transactions.stream().mapToInt(Transaction::getValue).max();
如果没有最大值可以给一个默认值:
int i = transactions.stream().mapToInt(Transaction::getValue).max().orElse(1);
数值范围
在Java 8中引入了两个可以用于IntStream和LongStream的静态方法,帮助生成这种1到100之间数字的范围:range和rangeClosed。这两个方法第一个参数 起始值,第二个参数结束值。但range是不包含结束值的,而rangeClosed则包含结束值。就是< 和<=的区别。
IntStream evenNumbers = IntStream.rangeClosed(1,100).filter(i->i%2==0);
System.out.println(evenNumbers.count());//50
如果是range方法 则只有49个结果 因为它不包含最后100这个数字。
range示例:取出1到100之间的勾股数:
Stream<double[]> stream1 = IntStream.rangeClosed(1, 100) .boxed() .flatMap(a -> IntStream.rangeClosed(a, 100) .mapToObj( b -> new double[]{a, b, Math.sqrt(a * a + b * b)} ).filter(t -> t[2] % 1 == 0)); stream1.limit(3).forEach(t -> System.out.println(t[0] + "," + t[1] + "," + t[2]));
构建流
1.由值创建流
Stream.of方法可以显示的创建一个流,它可以接受任意数量的参数。例如:创建一个字符串流,将字符串转换为大写,再打印出来:
Stream<String> stringStream = Stream.of("Java 8", "Lambdas", "in", "Action");
stringStream.map(String::toUpperCase).forEach(System.out::println);
还可以使用mepty得到一个空流:
Stream<String> emptyString = Stream.empty();
2.由数组创建流
Arrays.Stream可以从数组创建一个流,它接受一个数组作为参数,例如你可以讲一个原始类型int的数组转换成一个IntStream:
int[] nums4 = {2,3,5,56,6,4,4,45,234,2}; IntStream stream2 = Arrays.stream(nums4);
3.由文件生成流
Files.lines可以从文件得到一个流,其中的每个元素都是该文件的一行。
Stream<String> lines = Files.lines(Paths.get("/Users/baidawei/Desktop/test.txt"), Charset.defaultCharset());
lines.forEach(c->System.out.println(c.toString()));
4.由函数生成流:创建无限流
Stream.iterate和Stream.generate这两个静态方法可以创建所谓的无限流:不像从固定集合创建的流那样有固定大小的流。由这两个产生的流会用给定的函数按需创建值,因此可以无穷的计算下去,一般来说应该使用limit来对这种流加以限制。
4.1 迭代
Stream.iterate(0,n->n+2) .limit(10) .forEach(System.out::println);
iterate 第一个参数是起始值,第二个参数是一个lambda表达式(UnaryOperator<T>)类型的,没有终止条件,按需计算。所以需要limit截断
4.2 生成
与iterate类似,generate也可以让你按需生成一个无限流。但generate不是依次对每个新生成的值应用函数的。它接受一个Supplier<T>类型的Lambda提供新的值:
Stream.generate(Math::random) .limit(5) .forEach(System.out::println);
我们使用的供应源(Math::radom)是无状态的:它不会在任何地方记录任何值。
小结:
1. 、筛选和切片:filter、distinct、skip、limit。
2、映射:map、flatMap。
3、查找:findFirst、findAny。
4、匹配:allMatch、anyMatch、noneMatch。
5、这些方法都利用了短路:找到结果就立即停止计算,没有必要处理整个流。
6、归约:reduce、聚合 计算最大 最小值。
7、filter和map等是无状态的,他们并不存储任何状态。reduce等操作需要存储状态才能计算一个值。sorted和distinct等操作也要存储状态,因为他们需要把六中的所有元素缓存起来才能返回一个新的流。这种操作称为有状态操作。
8、流油三种基本的原始类型特化:IntStream、DoubleStream和LongStream。
9、流不尽可以从集合创建,也可以从值、数组、文件以及iterate与generate等方法创建。
10、无限流是没有固定大小的流。