Java Stream

一、Stream流介绍

1.1 集合处理数据的弊端

当我们需要对集合中的元素进行操作的时候，除了必需的添加、删除、获取外，最典型的就是集合遍历。我们来体验集合操作数据的弊端，需求如下：

一个ArrayList集合中存储有以下数据:

张无忌,周芷若,赵敏,张强,张三丰

需求:

1.拿到所有姓张的

2.拿到名字长度为3个字的

3.打印这些数据

代码如下：

public static void main(String[] args) {
   // 一个ArrayList集合中存储有以下数据:张无忌,周芷若,赵敏,张强,张三丰
   // 需求:1.拿到所有姓张的 2.拿到名字长度为3个字的 3.打印这些数据
   ArrayList<String> list = new ArrayList<>();
   Collections.addAll(list, "张无忌", "周芷若", "赵敏", "张强", "张三丰");
   // 1.拿到所有姓张的
   ArrayList<String> zhangList = new ArrayList<>(); // {"张无忌", "张强", "张三丰"}
   for (String name : list) {
    if (name.startsWith("张")) {
      zhangList.add(name);
    }
  }
   // 2.拿到名字长度为3个字的
   ArrayList<String> threeList = new ArrayList<>(); // {"张无忌", "张三丰"}
   for (String name : zhangList) {
     if (name.length() == 3) {
      threeList.add(name);
    }
   }
   // 3.打印这些数据
   for (String name : threeList) {
     System.out.println(name);
   }
}

循环遍历的弊端

这段代码中含有三个循环，每一个作用不同：

首先筛选所有姓张的人；
然后筛选名字有三个字的人；
最后进行对结果进行打印输出。

每当我们需要对集合中的元素进行操作的时候，总是需要进行循环、循环、再循环。这是理所当然的么？不是。循环是做事情的方式，而不是目的。每个需求都要循环一次，还要搞一个新集合来装数据，如果希望再次遍历，只能再使用另一个循环从头开始。

那Stream能给我们带来怎样更加优雅的写法呢？

Stream的更优写法

下面来看一下借助Java 8的Stream API，修改后的代码：

public class Demo03StreamFilter {
public static void main(String[] args) {
   List<String> list = new ArrayList<>();
       list.add("张无忌");
       list.add("周芷若");
       list.add("赵敏");
       list.add("张强");
       list.add("张三丰");
       list.stream()
           .filter(s -> s.startsWith("张"))
           .filter(s -> s.length() == 3)
           .forEach(System.out::println);
   }
}

直接阅读代码的字面意思即可完美展示无关逻辑方式的语义：获取流、过滤姓张、过滤长度为3、逐一打印。我们真正要做的事情内容被更好地体现在代码中。

1.2 Stream流式思想概述

注意：Stream和IO流(InputStream/OutputStream)没有任何关系，请暂时忘记对传统IO流的固有印象！

Stream流式思想类似于工厂车间的“生产流水线”，Stream流不是一种数据结构，不保存数据，而是对数据进行加工处理。Stream可以看作是流水线上的一个工序。在流水线上，通过多个工序让一个原材料加工成一个商品。

Stream API能让我们快速完成许多复杂的操作，如筛选、切片、映射、查找、去除重复，统计，匹配和归约。

1.3 小结

首先我们了解了集合操作数据的弊端,每次都需要循环遍历,还要创建新集合,很麻烦

Stream是流式思想,相当于工厂的流水线,对集合中的数据进行加工处理

二、获取Stream流的两种方式

获取一个流非常简单，有以下几种常用的方式：

所有的 Collection 集合都可以通过 stream 默认方法获取流；
Stream 接口的静态方法 of 可以获取数组对应的流。

2.1 根据Collection获取流

首先， java.util.Collection 接口中加入了default方法 stream 用来获取流，所以其所有实现类均可获取流。

public interface Collection {
    default Stream<E> stream()
}

import java.util.*;
import java.util.stream.Stream;
public class Demo04GetStream {
public static void main(String[] args) {
   // 集合获取流
   // Collection接口中的方法: default Stream<E> stream() 获取流
   List<String> list = new ArrayList<>();
   // ...
   Stream<String> stream1 = list.stream();
   Set<String> set = new HashSet<>();
   // ...
   Stream<String> stream2 = set.stream();
   Vector<String> vector = new Vector<>();
   // ...
   Stream<String> stream3 = vector.stream();
  }
}

java.util.Map 接口不是 Collection 的子接口，所以获取对应的流需要分key、value或entry等情况：

import java.util.HashMap;
import java.util.Map;
import java.util.stream.Stream;
public class Demo05GetStream {
public static void main(String[] args) {
   // Map获取流
   Map<String, String> map = new HashMap<>();
   // ...
   Stream<String> keyStream = map.keySet().stream();
   Stream<String> valueStream = map.values().stream();
   Stream<Map.Entry<String, String>> entryStream = map.entrySet().stream();
  }
}

2.2 Stream中的静态方法of获取流

由于数组对象不可能添加默认方法，所以 Stream 接口中提供了静态方法 of ，使用很简单：

import java.util.stream.Stream;
public class Demo06GetStream {
public static void main(String[] args) {

   // Stream中的静态方法: static Stream of(T... values)
   Stream<String> stream6 = Stream.of("aa", "bb", "cc");

   String[] arr = {"aa", "bb", "cc"};
   Stream<String> stream7 = Stream.of(arr);
   Integer[] arr2 = {11, 22, 33};

   Stream<Integer> stream8 = Stream.of(arr2);

   // 注意:基本数据类型的数组不行
   int[] arr3 = {11, 22, 33};
   Stream<int[]> stream9 = Stream.of(arr3);
  }
}

备注： of 方法的参数其实是一个可变参数，所以支持数组。

三、Stream常用方法和注意事项

3.1 Stream常用方法

Stream流模型的操作很丰富，这里介绍一些常用的API。这些方法可以被分成两种：

终结方法：返回值类型不再是Stream 类型的方法，不再支持链式调用。本小节中，终结方法包括count 和forEach 方法。
非终结方法：返回值类型仍然是Stream 类型的方法，支持链式调用。（除了终结方法外，其余方法均为非终结方法。）
对比Spark的两种算子

备注：本小节之外的更多方法，请自行参考API文档。

3.2 Stream注意事项(重要)

Stream只能操作一次
Stream方法返回的是新的流
Stream不调用终结方法，中间的操作不会执行

3.3 forEach方法

forEach 用来遍历流中的数据

void forEach(Consumer<? super T> action);

该方法接收一个 Consumer 接口函数，会将每一个流元素交给该函数进行处理。例如：

@Test
public void testForEach() {

   List<String> one = new ArrayList<>();
   Collections.addAll(one, "迪丽热巴", "宋远桥", "苏星河", "老子", "庄子", "孙子");

   /*one.stream().forEach((String s) -> {
   System.out.println(s);
   });*/

   // 简写
   // one.stream().forEach(s -> System.out.println(s));
   one.stream().forEach(System.out::println);
}

3.4 count方法

Stream流提供 count 方法来统计其中的元素个数：

long count();

该方法返回一个long值代表元素个数。基本使用：

@Test
public void testCount() {
   List<String> one = new ArrayList<>();
   Collections.addAll(one, "迪丽热巴", "宋远桥", "苏星河", "老子", "庄子", "孙子");
   System.out.println(one.stream().count());
}

3.5 filter方法

filter用于过滤数据，返回符合过滤条件的数据

可以通过 filter 方法将一个流转换成另一个子集流。方法声明：

Stream<T> filter(Predicate<? super T> predicate);

该接口接收一个 Predicate 函数式接口参数（可以是一个Lambda或方法引用）作为筛选条件。

Stream流中的 filter 方法基本使用的代码如：

@Test
public void testFilter() {

   List<String> one = new ArrayList<>();
   Collections.addAll(one, "迪丽热巴", "宋远桥", "苏星河", "老子", "庄子", "孙子");

   one.stream()
      .filter(s -> s.length() == 2)
      .forEach(System.out::println);
}

在这里通过Lambda表达式来指定了筛选的条件：姓名长度为2个字。

3.6 limit方法

limit 方法可以对流进行截取，只取用前n个。方法签名：

Stream<T> limit(long maxSize);

参数是一个long型，如果集合当前长度大于参数则进行截取。否则不进行操作。基本使用：

@Test
public void testLimit() {
List<String> one = new ArrayList<>();
   Collections.addAll(one, "迪丽热巴", "宋远桥", "苏星河", "老子", "庄子", "孙子");
   one.stream().limit(3).forEach(System.out::println);
}

3.7 skip方法

如果希望跳过前几个元素，可以使用 skip 方法获取一个截取之后的新流：

Stream<T> skip(long n);

如果流的当前长度大于n，则跳过前n个；否则将会得到一个长度为0的空流。基本使用：

@Test
public void testSkip() {
   List<String> one = new ArrayList<>();
   Collections.addAll(one, "迪丽热巴", "宋远桥", "苏星河", "老子", "庄子", "孙子");
   one.stream().skip(2).forEach(System.out::println);
}

3.8 map方法

如果需要将流中的元素映射到另一个流中，可以使用 map 方法。方法签名：

<R> Stream<R> map(Function<? super T, ? extends R> mapper);

该接口需要一个 Function 函数式接口参数，可以将当前流中的T类型数据转换为另一种R类型的流。

Stream流中的 map 方法基本使用的代码如：

@Test
public void testMap() {
   Stream<String> original = Stream.of("11", "22", "33");
   original.map(Integer::parseInt).forEach(System.out::println);
}

这段代码中， map 方法的参数通过方法引用，将字符串类型转换成为了int类型（并自动装箱为 Integer 类对象）。

3.9 sorted方法

如果需要将数据排序，可以使用 sorted 方法。方法签名：

Stream<T> sorted();
Stream<T> sorted(Comparator<? super T> comparator);

基本使用

Stream流中的 sorted 方法基本使用的代码如：

@Test
public void testSorted() {
// sorted(): 根据元素的自然顺序排序
// sorted(Comparator<? super T> comparator): 根据比较器指定的规则排序
   Stream.of(33, 22, 11, 55)
                           .sorted()
                           .sorted((o1, o2) -> o2 - o1)
                           .forEach(System.out::println);
}

这段代码中， sorted 方法根据元素的自然顺序排序，也可以指定比较器排序。

3.10 distinct方法

如果需要去除重复数据，可以使用 distinct 方法。方法签名：

Stream<T> distinct();

基本使用

Stream流中的 distinct 方法基本使用的代码如：

@Test
public void testDistinct() {
   Stream.of(22, 33, 22, 11, 33)
       .distinct()
       .forEach(System.out::println);
}

如果是自定义类型如何是否也能去除重复的数据呢?

@Test
public void testDistinct2() {
Stream.of(
   new Person("刘德华", 58),
   new Person("张学友", 56),
   new Person("张学友", 56),
   new Person("黎明", 52))
   .distinct()
   .forEach(System.out::println);
}

public class Person {
   private String name;
   private int age;
   // 省略其他
}

自定义类型是根据对象的hashCode和equals来去除重复元素的。

3.11match方法

如果需要判断数据是否匹配指定的条件，可以使用 Match 相关方法。方法签名：

boolean allMatch(Predicate<? super T> predicate);
boolean anyMatch(Predicate<? super T> predicate);
boolean noneMatch(Predicate<? super T> predicate)

基本使用

Stream流中的 Match 相关方法基本使用的代码如：

@Test
public void testMatch() {
boolean b = Stream.of(5, 3, 6, 1)
       // .allMatch(e -> e > 0); // allMatch: 元素是否全部满足条件
       // .anyMatch(e -> e > 5); // anyMatch: 元素是否任意有一个满足条件
       .noneMatch(e -> e < 0); // noneMatch: 元素是否全部不满足条件
       System.out.println("b = " + b);
}

3.12 find方法

如果需要找到某些数据，可以使用 find 相关方法。方法签名：

Optional<T> findFirst();
Optional<T> findAny();

基本使用

Stream流中的 find 相关方法基本使用的代码如：

@Test
public void testFind() {
       Optional<Integer> first = Stream.of(5, 3, 6, 1).findFirst();
       System.out.println("first = " + first.get());
       
       Optional<Integer> any = Stream.of(5, 3, 6, 1).findAny();
       System.out.println("any = " + any.get());
}

3.13 max和min方法

如果需要获取最大和最小值，可以使用 max 和 min 方法。方法签名：

Optional<T> max(Comparator<? super T> comparator);
Optional<T> min(Comparator<? super T> comparator);

基本使用

Stream流中的 max 和 min 相关方法基本使用的代码如：

@Test
public void testMax_Min() {
   Optional<Integer> max = Stream.of(5, 3, 6, 1).max((o1, o2) -> o1 - o2);
   System.out.println("first = " + max.get());

   Optional<Integer> min = Stream.of(5, 3, 6, 1).min((o1, o2) -> o1 - o2);
   System.out.println("any = " + min.get());
}

3.14 reduce方法

如果需要将所有数据归纳得到一个数据，可以使用 reduce 方法。方法签名：

T reduce(T identity, BinaryOperator<T> accumulator);

基本使用

Stream流中的 reduce 相关方法基本使用的代码如：

@Test
public void testReduce() {
   int reduce = Stream.of(4, 5, 3, 9)
               .reduce(0, (a, b) -> {
                       System.out.println("a = " + a + ", b = " + b);return a + b;
               });
   // reduce:
   // 第一次将默认做赋值给x, 取出第一个元素赋值给y,进行操作
   // 第二次,将第一次的结果赋值给x, 取出二个元素赋值给y,进行操作
   // 第三次,将第二次的结果赋值给x, 取出三个元素赋值给y,进行操作
   // 第四次,将第三次的结果赋值给x, 取出四个元素赋值给y,进行操作
   System.out.println("reduce = " + reduce);
   // 化简
   int reduce2 = Stream.of(4, 5, 3, 9)
                       .reduce(0, (x, y) -> {return Integer.sum(x, y);});
   // 进一步化简
    int reduce3 = Stream.of(4, 5, 3, 9).reduce(0, Integer::sum);
    
   int max = Stream.of(4, 5, 3, 9)
                   .reduce(0, (x, y) -> {
                   return x > y ? x : y;
                  });
   System.out.println("max = " + max);

}

x = 0, y = 4
x = 4, y = 5
x = 9, y = 3
x = 12, y = 9
reduce = 21
max = 9

3.15 map和reduce组合使用

@Test
public void testMapReduce() {
       // 求出所有年龄的总和
   int totalAge = Stream.of(
       new Person("刘德华", 58),
       new Person("张学友", 56),
       new Person("郭富城", 54),
       new Person("黎明", 52))
       .map((p) -> p.getAge())
       .reduce(0, (x, y) -> x + y);
   System.out.println("totalAge = " + totalAge);

   // 找出最大年龄
   int maxAge = Stream.of(
       new Person("刘德华", 58),
       new Person("张学友", 56),
       new Person("郭富城", 54),
    new Person("黎明", 52))
       .map((p) -> p.getAge())
       .reduce(0, (x, y) -> x > y ? x : y);
   System.out.println("maxAge = " + maxAge);

   // 统计 数字2 出现的次数
   int count = Stream.of(1, 2, 2, 1, 3, 2)
   .map(i -> {
       if (i == 2) {
         return 1;
       } else {
         return 0;
        }
       })
       .reduce(0, Integer::sum);
   System.out.println("count = " + count);
}

3.16 mapToIn

如果需要将Stream中的Integer类型数据转成int类型，可以使用 mapToInt 方法。方法签名：

IntStream mapToInt(ToIntFunction<? super T> mapper);

Stream流中的 mapToInt 相关方法基本使用的代码如：

@Test
public void test1() {
   // Integer占用的内存比int多,在Stream流操作中会自动装箱和拆箱
   Stream<Integer> stream = Arrays.stream(new Integer[]{1, 2, 3, 4, 5});
   // 把大于3的和打印出来
   // Integer result = stream
   // .filter(i -> i.intValue() > 3)

   // .reduce(0, Integer::sum);
   // System.out.println(result);
   // 先将流中的Integer数据转成int,后续都是操作int类型
   IntStream intStream = stream.mapToInt(Integer::intValue);
   int reduce = intStream
           .filter(i -> i > 3)
           .reduce(0, Integer::sum);
       System.out.println(reduce);

   // 将IntStream转化为Stream<Integer>
   IntStream intStream1 = IntStream.rangeClosed(1, 10);
   Stream<Integer> boxed = intStream1.boxed();
   boxed.forEach(s -> System.out.println(s.getClass() + ", " + s));
}

3.17 concat方法

如果有两个流，希望合并成为一个流，那么可以使用 Stream 接口的静态方法 concat ：

static <T> Stream<T> concat(Stream<? extends T> a, Stream<? extends T> b)

备注：这是一个静态方法，与 java.lang.String 当中的 concat 方法是不同的。

该方法的基本使用代码如：

@Test
public void testContact() {
   Stream<String> streamA = Stream.of("张三");
   Stream<String> streamB = Stream.of("李四");
   Stream<String> result = Stream.concat(streamA, streamB);
   result.forEach(System.out::println);
}

3.18 Stream综合案例

现在有两个 ArrayList 集合存储队伍当中的多个成员姓名，要求使用传统的for循环（或增强for循环）依次进行以下若干操作步骤：

第一个队伍只要名字为3个字的成员姓名；
第一个队伍筛选之后只要前3个人；
第二个队伍只要姓张的成员姓名；
第二个队伍筛选之后不要前2个人；
将两个队伍合并为一个队伍；
根据姓名创建 Person 对象；
打印整个队伍的Person对象信息。

两个队伍（集合）的代码如下：

public class DemoArrayListNames {
public static void main(String[] args) {
       List<String> one = List.of("迪丽热巴", "宋远桥", "苏星河", "老子", "庄子", "孙子", "洪七公");
       List<String> two = List.of("古力娜扎", "张无忌", "张三丰", "赵丽颖", "张二狗", "张天爱","张三");
       // ....
       }
}

而 Person 类的代码为：

public class Person {
   private String name;
   public Person() {}
    public Person(String name) {
    this.name = name;
   }
   @Override
   public String toString() {
    return "Person{name='" + name + "'}";
   }
   public String getName() {
    return name;
   }
   public void setName(String name) {
    this.name = name;
   }
}

传统方式

使用for循环 , 示例代码:

public class DemoArrayListNames {
    public static void main(String[] args) {
        List<String> one = List.of("迪丽热巴", "宋远桥", "苏星河", "老子", "庄子", "孙子", "洪七公");
        List<String> two = List.of("古力娜扎", "张无忌", "张三丰", "赵丽颖", "张二狗", "张天爱", "张三");

        // 第一个队伍只要名字为3个字的成员姓名；
        List<String> oneA = new ArrayList<>();

        for (String name : one) {
            if (name.length() == 3) {
                oneA.add(name);
            }
        }

        // 第一个队伍筛选之后只要前3个人；
        List<String> oneB = new ArrayList<>();
        for (int i = 0; i < 3; i++) {
            oneB.add(oneA.get(i));
        }

        // 第二个队伍只要姓张的成员姓名；
        List<String> twoA = new ArrayList<>();
        for (String name : two) {
            if (name.startsWith("张")) {
                twoA.add(name);
            }
        }

        // 第二个队伍筛选之后不要前2个人；
        List<String> twoB = new ArrayList<>();
        for (int i = 2; i < twoA.size(); i++) {
            twoB.add(twoA.get(i));
        }

        // 将两个队伍合并为一个队伍；
        List<String> totalNames = new ArrayList<>();
        totalNames.addAll(oneB);
        totalNames.addAll(twoB);

        // 根据姓名创建Person对象；
        List<Person> totalPersonList = new ArrayList<>();
        for (String name : totalNames) {
            totalPersonList.add(new Person(name));
        }
        // 打印整个队伍的Person对象信息。
        for (Person person : totalPersonList) {
            System.out.println(person);
        }

    }
}

运行结果为：

Person{name='宋远桥'}
Person{name='苏星河'}
Person{name='洪七公'}
Person{name='张二狗'}
Person{name='张天爱'}
Person{name='张三'}

Stream方式

等效的Stream流式处理代码为：

public class DemoStreamNames {
    public static void main(String[] args) {
        List<String> one = List.of("迪丽热巴", "宋远桥", "苏星河", "老子", "庄子", "孙子", "洪七公");
        List<String> two = List.of("古力娜扎", "张无忌", "张三丰", "赵丽颖", "张二狗", "张天爱", "张三");

        // 第一个队伍只要名字为3个字的成员姓名；
        // 第一个队伍筛选之后只要前3个人；
        Stream<String> streamOne = one.stream().filter(s -> s.length() == 3).limit(3);

        // 第二个队伍只要姓张的成员姓名；
        // 第二个队伍筛选之后不要前2个人；
        Stream<String> streamTwo = two.stream().filter(s -> s.startsWith("张")).skip(2);

        // 将两个队伍合并为一个队伍；
        // 根据姓名创建Person对象；
        // 打印整个队伍的Person对象信息。
        Stream.concat(streamOne, streamTwo).map(Person::new).forEach(System.out::println);

    }

}

运行效果完全一样：

Person{name='宋远桥'}
Person{name='苏星河'}
Person{name='洪七公'}
Person{name='张二狗'}
Person{name='张天爱'}
Person{name='张三'}

四、收集Stream流中的结果

对流操作完成之后，如果需要将流的结果保存到数组或集合中，可以收集流中的数据

4.1 Stream流中的结果到集合中

Stream流提供 collect 方法，其参数需要一个 java.util.stream.Collector 接口对象来指定收集到哪种集合中。java.util.stream.Collectors 类提供一些方法，可以作为 Collector`接口的实例：

public static Collector> toList() ：转换为 List 集合。

public static Collector> toSet() ：转换为 Set 集合。

下面是这两个方法的基本使用代码：

// 将流中数据收集到集合中

@Test
public void testStreamToCollection() {
Stream<String> stream = Stream.of("aa", "bb", "cc");
   // List<String> list = stream.collect(Collectors.toList());
   // Set<String> set = stream.collect(Collectors.toSet());
   ArrayList<String> arrayList = stream.collect(Collectors.toCollection(ArrayList::new));
   HashSet<String> hashSet = stream.collect(Collectors.toCollection(HashSet::new));
}

4.2 Stream流中的结果到数组中

Stream提供 toArray 方法来将结果放到一个数组中，返回值类型是Object[]的：

Object[] toArray();

其使用场景如：

@Test
public void testStreamToArray() {
   Stream<String> stream = Stream.of("aa", "bb", "cc");
   // Object[] objects = stream.toArray();
   // for (Object obj : objects) {
   // System.out.println();
   // }

   String[] strings = stream.toArray(String[]::new);
   for (String str : strings) {
     System.out.println(str);
   }
}

4.3 对流中数据进行聚合计算

当我们使用Stream流处理数据后，可以像数据库的聚合函数一样对某个字段进行操作。比如获取最大值，获取最小值，求总和，平均值，统计数量。

@Test
public void testStreamToOther() {
   Stream<Student> studentStream = Stream.of(
                   new Student("赵丽颖", 58, 95),
                   new Student("杨颖", 56, 88),
                   new Student("迪丽热巴", 56, 99),
                   new Student("柳岩", 52, 77));
   // 获取最大值
    Optional<Student> collect = studentStream.collect(Collectors.maxBy((o1, o2) ->
    o1.getSocre() - o2.getSocre()));

   // 获取最小值
    Optional<Student> collect = studentStream.collect(Collectors.minBy((o1, o2) ->
    o1.getSocre() - o2.getSocre()));
   // System.out.println(collect.get());

   // 求总和
    int sumAge = studentStream.collect(Collectors.summingInt(s -> s.getAge()));
    System.out.println("sumAge = " + sumAge);

   //平均值
    double avgScore = studentStream.collect(Collectors.averagingInt(s -> s.getSocre()));
    System.out.println("avgScore = " + avgScore);

   // 统计数量
    Long count = studentStream.collect(Collectors.counting());
    System.out.println("count = " + count);
}

4.4 对流中数据进行分组

当我们使用Stream流处理数据后，可以根据某个属性将数据分组：

// 分组
@Test
public void testGroup() {
   Stream<Student> studentStream = Stream.of(
       new Student("赵丽颖", 52, 95),
       new Student("杨颖", 56, 88),
       new Student("迪丽热巴", 56, 55),
       new Student("柳岩", 52, 33));
   // Map<Integer, List<Student>> map = studentStream.collect(Collectors.groupingBy(Student::getAge));

   // 将分数大于60的分为一组,小于60分成另一组
   Map<String, List<Student>> map = studentStream.collect(Collectors.groupingBy((s) ->{
           if (s.getSocre() > 60) {
             return "及格";
            }else {
             return "不及格";
            }
           }));
   map.forEach((k, v) -> {
         System.out.println(k + "::" + v);
      });
}

效果：

不及格::[Student{name='迪丽热巴', age=56, socre=55}, Student{name='柳岩', age=52, socre=33}]
及格::[Student{name='赵丽颖', age=52, socre=95}, Student{name='杨颖', age=56, socre=88}]

4.5 对流中数据进行多级分组

还可以对数据进行多级分组：

// 多级分组
@Test
public void testCustomGroup() {
   Stream<Student> studentStream = Stream.of(
       new Student("赵丽颖", 52, 95),
       new Student("杨颖", 56, 88),
       new Student("迪丽热巴", 56, 99),
       new Student("柳岩", 52, 77));
   Map<Integer, Map<String, List<Student>>> map =
   studentStream.collect(Collectors.groupingBy(s -> s.getAge(), Collectors.groupingBy(s -> {
           if (s.getSocre() >= 90) {
            return "优秀";
            } else if (s.getSocre() >= 80 && s.getSocre() < 90) {
            return "良好";
            } else if (s.getSocre() >= 80 && s.getSocre() < 80) {
            return "及格";
            } else {
            return "不及格";
            }
           })));

   map.forEach((k, v) -> {
     System.out.println(k + " == " + v);
   });
}

效果：

52 == {不及格=[Student{name='柳岩', age=52, socre=77}], 优秀=[Student{name='赵丽颖', age=52,
socre=95}]}
56 == {优秀=[Student{name='迪丽热巴', age=56, socre=99}], 良好=[Student{name='杨颖', age=56,
socre=88}]}

4.6 对流中数据进行分区

Collectors.partitioningBy 会根据值是否为true，把集合分割为两个列表，一个true列表，一个false列表。

// 分区
@Test
public void testPartition() {
   Stream<Student> studentStream = Stream.of(
       new Student("赵丽颖", 52, 95),
       new Student("杨颖", 56, 88),
       new Student("迪丽热巴", 56, 99),
       new Student("柳岩", 52, 77));
   // partitioningBy会根据值是否为true，把集合分割为两个列表，一个true列表，一个false列表。
   Map<Boolean, List<Student>> map = studentStream.collect(Collectors.partitioningBy(s ->s.getSocre() > 90));

   map.forEach((k, v) -> {
     System.out.println(k + " == " + v);
   });
}

效果：

false == [Student{name='杨颖', age=56, socre=88}, Student{name='柳岩', age=52, socre=77}]
true == [Student{name='赵丽颖', age=52, socre=95}, Student{name='迪丽热巴', age=56, socre=99}]

4.7 对流中数据进行拼接

// 拼接
@Test
public void testJoining() {
Stream<Student> studentStream = Stream.of(
   new Student("赵丽颖", 52, 95),
   new Student("杨颖", 56, 88),
   new Student("迪丽热巴", 56, 99),
   new Student("柳岩", 52, 77));
   String collect = studentStream
           .map(Student::getName)
           .collect(Collectors.joining(">_<", "^_^", "^v^"));
   System.out.println(collect);
}

效果：

^_^赵丽颖>_<杨颖>_<迪丽热巴>_<柳岩^v^

五、并行的Stream流

5.1 串行的Stream流

目前我们使用的Stream流是串行的，就是在一个线程上执行。

@Test
public void test0Serial() {
   long count = Stream.of(4, 5, 3, 9, 1, 2, 6)
           .filter(s -> {
                System.out.println(Thread.currentThread() + ", s = " + s);
               return true;
           })
           .count();

   System.out.println("count = " + count);
}

效果：

Thread[main,5,main], s = 4
Thread[main,5,main], s = 5
Thread[main,5,main], s = 3
Thread[main,5,main], s = 9
Thread[main,5,main], s = 1
Thread[main,5,main], s = 2
Thread[main,5,main], s = 6

5.2 并行的Stream流

parallelStream其实就是一个并行执行的流。它通过默认的ForkJoinPool，可能提高多线程任务的速度。

获取并行Stream流的两种方式

直接获取并行的流
将串行流转成并行流

@Test
public void testgetParallelStream() {
       ArrayList<Integer> list = new ArrayList<>();
       // 直接获取并行的流
        Stream<Integer> stream = list.parallelStream();
       // 将串行流转成并行流
       Stream<Integer> stream = list.stream().parallel();
}

并行操作代码：

@Test
public void test0Parallel() {
   long count = Stream.of(4, 5, 3, 9, 1, 2, 6)
           .parallel() // 将流转成并发流,Stream处理的时候将才去
           .filter(s -> {
             System.out.println(Thread.currentThread() + ", s = " + s);
            return true;
           })
           .count();
   System.out.println("count = " + count);
}

效果：

Thread[ForkJoinPool.commonPool-worker-13,5,main], s = 3
Thread[ForkJoinPool.commonPool-worker-19,5,main], s = 6
Thread[main,5,main], s = 1
Thread[ForkJoinPool.commonPool-worker-5,5,main], s = 5
Thread[ForkJoinPool.commonPool-worker-23,5,main], s = 4
Thread[ForkJoinPool.commonPool-worker-27,5,main], s = 2
Thread[ForkJoinPool.commonPool-worker-9,5,main], s = 9
count = 7

5.3 并行和串行Stream流的效率对比

使用for循环，串行Stream流，并行Stream流来对5亿个数字求和。看消耗的时间。

public class Demo06 {
private static long times = 50000000000L;
private long start;

   @Before
   public void init() {
    start = System.currentTimeMillis();
   }

   @After
   public void destory() {
       long end = System.currentTimeMillis();
       System.out.println("消耗时间: " + (end - start));

   }

   // 测试效率,parallelStream 120
   @Test
   public void parallelStream() {
       System.out.println("serialStream");
       LongStream.rangeClosed(0, times)
                   .parallel()
                   .reduce(0, Long::sum);
   }

   // 测试效率,普通Stream 342
   @Test
   public void serialStream() {
       System.out.println("serialStream");
       LongStream.rangeClosed(0, times)
        .reduce(0, Long::sum);
   }

   // 测试效率,正常for循环 421
   @Test
   public void forAdd() {
       System.out.println("forAdd");
       long result = 0L;
       for (long i = 1L; i < times; i++) {
         result += i;
       }
   }
}

我们可以看到parallelStream的效率是最高的。

Stream并行处理的过程会分而治之，也就是将一个大任务切分成多个小任务，这表示每个任务都是一个操作。

5.4 parallelStream线程安全问题

解决parallelStream线程安全问题

// 并行流注意事项
@Test
public void parallelStreamNotice() {

   ArrayList<Integer> list = new ArrayList<Integer>();
   for (int i = 0; i < 1000; i++) {
    list.add(i);
}

   List<Integer> newList = new ArrayList<>();
   // 使用并行的流往集合中添加数据
   list.parallelStream()
       .forEach(s -> {
         newList.add(s);
    });

   System.out.println("newList = " + newList.size());
}

运行效果：

newList = 903

我们明明是往集合中添加1000个元素，而实际上只有903个元素。

解决方法：

加锁、使用线程安全的集合或者调用Stream的 toArray() / collect() 操作就是满足线程安全的了。

posted @ 2022-04-02 16:03 王陸阅读(1439) 评论(0) 编辑收藏举报

刷新页面返回顶部

王陸

我可不是为了被全人类喜欢才活着的，只要对于某一个人来说我是必要的，我就能活下去。

Java Stream

一、Stream流介绍

1.1 集合处理数据的弊端

1.2 Stream流式思想概述

1.3 小结

二、获取Stream流的两种方式

2.1 根据Collection获取流

2.2 Stream中的静态方法of获取流

三、Stream常用方法和注意事项

3.1 Stream常用方法

3.2 Stream注意事项(重要)

3.3 forEach方法

3.4 count方法

3.5 filter方法

3.6 limit方法

3.7 skip方法

3.8 map方法

3.9 sorted方法

3.10 distinct方法

3.11match方法

3.12 find方法

3.13 max和min方法

3.14 reduce方法

3.15 map和reduce组合使用

3.16 mapToIn

3.17 concat方法

3.18 Stream综合案例

四、收集Stream流中的结果

4.1 Stream流中的结果到集合中

4.2 Stream流中的结果到数组中

4.3 对流中数据进行聚合计算

4.4 对流中数据进行分组

4.5 对流中数据进行多级分组

4.6 对流中数据进行分区

4.7 对流中数据进行拼接

五、并行的Stream流

5.1 串行的Stream流

5.2 并行的Stream流

5.3 并行和串行Stream流的效率对比

5.4 parallelStream线程安全问题

公告