Stream是Java8中新加入的api,更准确的说:

Java 8 中的 Stream 是对集合(Collection)对象功能的增强,它专注于对集合对象进行各种非常便利、高效的聚合操作,或者大批量数据操作 。Stream API 借助于同样新出现的 Lambda 表达式,极大的提高编程效率和程序可读性。

以前我们处理复杂的数据只能通过各种for循环,不仅不美观,而且时间长了以后可能自己都看不太明白以前的代码了,但有Stream以后,通过filter,map,limit等等方法就可以使代码更加简洁并且更加语义化。

 

Stream 创建

在使用流之前,首先需要拥有一个数据源,并通过StreamAPI提供的一些方法获取该数据源的流对象。有很多方法可以创建不同源的 stream 实例,stream 实例一旦创建,将不会修改其源,因此我们从单个源创建多个 stream 实例。

 

Empty Stream

如果我们想创建一个空的 Stream,可以使用 empty() 方法,具体如下:

Stream<String> iteblogEmptyStream = Stream.empty();

 

通常在 streams 没有元素然后不想返回 null 的情况下使用:

public Stream<String> streamOf(List<String> list) {
    return list == null || list.isEmpty() ? Stream.empty() : list.stream();
}

 

通过集合(Collection)创建 Stream

Java 中的任何继承 Collection 接口的类都可以创建 Stream:

List<String> list = Lists.newArrayList("iteblog", "iteblog_hadoop");
Stream<String> listStream = list.stream();

Set<String> set = Sets.newHashSet();
Stream<String> setStream = set.stream();

 

通过数组(Array)创建 Stream

数组也可以创建 Stream:

Stream<String> streamOfArray = Stream.of("a", "b", "c");

 

当然,我们也可以通过已有的数组来创建 Stream :

String[] iteblogArr = new String[]{"iteblog", "iteblog_hadoop", "java 8"};
Stream<String> streamOfArrayFull = Arrays.stream(iteblogArr);
Stream<String> streamOfArrayPart = Arrays.stream(iteblogArr, 1, 3);

 

通过 Stream.builder() 创建 Stream Stream 提供了 builder 方法来创建 Stream:

Stream streamBuilder = Stream.builder().add("iteblog").add("iteblog_hadoop").add("java").build();
Stream<Object> streamBuilder = Stream.builder().add("iteblog").add("iteblog_hadoop").add("java").build();

 

上面创建的 Stream 类型是 Stream,如果我们想创建指定类型的 Stream,需要显示地指定类型

Stream<String> streamBuilder = Stream.<String>builder().add("iteblog").add("iteblog_hadoop").add("java").build();

 

通过 Stream.generate() 创建 Stream Stream.generate() 方法接收一个 Supplier 类型的参数来生成元素,生成的 stream 大小是无限的,所以我们需要指定 stream 生成的大小,以免出现内存不够的问题:

Stream<String> streamGenerated = Stream.generate(() -> "iteblog").limit(88);

 

通过 Stream.iterate() 创建 Stream 我们也可以通过 Stream.iterate() 来创建 Stream

Stream<Integer> streamIterated = Stream.iterate(2, n -> n * 2).limit(88);

Stream.iterate 方法的第一个参数将是这个 Stream 的第一个值,第二个元素将是前一个元素乘以 2。和 Stream.generate() 方法一样,我们也需要指定 stream 生成的大小,以免出现内存不够的问题。

 

通过原子类型创建 Stream

Java 8 中的 int, long 和 double 三个原子类型可以用来创建 streams,对应的接口分别是 IntStream, LongStream, DoubleStream

IntStream intStream = IntStream.range(0, 10);
LongStream longStream = LongStream.rangeClosed(0, 10);
DoubleStream doubleStream = DoubleStream.of(1.0, 2.0);
range(int startInclusive, int endExclusive)

 

相当于下面的代码:

for (long i = startInclusive; i < endExclusive ; i++) { ... }
rangeClosed(int startInclusive, int endInclusive) 

 

相当于下面的代码:

for (long i = startInclusive; i <= endInclusive ; i++) { ... }

 

区别大家应该看出来了:rangeClosed 生成的 Stream 包含最后一个元素,而 range 缺不是。当然,Java 8 中的 Random 类也为我们添加了生成上面三个原子类型对应的 Stream:

Random random = new Random();
IntStream intStream = random.ints(10);
LongStream longs = random.longs(10);
DoubleStream doubleStream = random.doubles(10);

 

通过字符串创建 Stream

Java 8 中的 String 类提供了 chars() 方法来创建 Stream:

IntStream streamOfChars = "abc".chars();

 

我们也可以通过下面方法来创建 Stream:

Stream<String> streamOfString = Pattern.compile(", ").splitAsStream("a, b, c");

 

通过文件创建 Stream

Java 8 的 Java NIO 类中 Files 允许我们通过 lines() 方法创建 Stream,文件中的每一行数据将变成 stream 中的一个元素:

Path path = Paths.get("/user/iteblog/test.txt");
Stream<String> streamOfStrings = Files.lines(path);
Stream<String> streamWithCharset = Files.lines(path, Charset.forName("UTF-8"));

 

Stream的分类

Stream可以分为串行与并行两种,串行流和并行流差别就是单线程和多线程的执行。

  • default Stream stream() : 返回串行流
  • default Stream parallelStream() : 返回并行流

stream()和parallelStream()方法返回的都是java.util.stream.Stream<E>类型的对象,说明它们在功能的使用上是没差别的。唯一的差别就是单线程和多线程的执行。

 

操作符

中间操作符

对于数据流来说,中间操作符在执行制定处理程序后,数据流依然可以传递给下一级的操作符。

中间操作符包含8种(排除了parallel,sequential,这两个操作并不涉及到对数据流的加工操作):

  • map(mapToInt,mapToLong,mapToDouble) 转换操作符,把比如A->B,这里默认提供了转int,long,double的操作符。
  • flatmap(flatmapToInt,flatmapToLong,flatmapToDouble) 拍平操作比如把 int[]{2,3,4} 拍平 变成 2,3,4 也就是从原来的一个数据变成了3个数据,这里默认提供了拍平成int,long,double的操作符。
  • limit 限流操作,比如数据流中有10个 我只要出前3个就可以使用。
  • distint 去重操作,对重复元素去重,底层使用了equals方法。
  • filter 过滤操作,把不想要的数据过滤。
  • peek 挑出操作,如果想对数据进行某些操作,如:读取、编辑修改等。
  • skip 跳过操作,跳过某些元素。
  • sorted(unordered) 排序操作,对元素排序,前提是实现Comparable接口,当然也可以自定义比较器。

终止操作符

数据经过中间加工操作,就轮到终止操作符上场了;终止操作符就是用来对数据进行收集或者消费的,数据到了终止操作这里就不会向下流动了,终止操作符只能使用一次。

  • collect 收集操作,将所有数据收集起来,这个操作非常重要,官方的提供的Collectors 提供了非常多收集器,可以说Stream 的核心在于Collectors。
  • count 统计操作,统计最终的数据个数。
  • findFirst、findAny 查找操作,查找第一个、查找任何一个 返回的类型为Optional。
  • noneMatch、allMatch、anyMatch 匹配操作,数据流中是否存在符合条件的元素 返回值为bool 值。
  • min、max 最值操作,需要自定义比较器,返回数据流中最大最小的值。
  • reduce 规约操作,将整个数据流的值规约为一个值,count、min、max底层就是使用reduce。
  • forEach、forEachOrdered 遍历操作,这里就是对最终的数据进行消费了。
  • toArray 数组操作,将数据流的元素转换成数组。

Stream 的一系列操作必须要使用终止操作,否者整个数据流是不会流动起来的,即处理操作不会执行。

 

map

可以看到 map 操作符要求输入一个Function的函数是接口实例,功能是将T类型转换成R类型的。

map操作将原来的单词 转换成了每个单的长度,利用了String自身的length()方法,该方法返回类型为int。

public class Main {

    public static void main(String[] args) {
        Stream.of("apple","banana","orange","waltermaleon","grape")
                .map(e->e.length()) //转成单词的长度 int
                .forEach(e->System.out.println(e)); //输出
    }
}

 

当然也可以这样,这里使用了成员函数引用。

public class Main {

    public static void main(String[] args) {
         Stream.of("apple","banana","orange","waltermaleon","grape")
                .map(String::length) //转成单词的长度 int
                .forEach(System.out::println);
    }
}

 

结果如图:

  • mapToInt 将数据流中得元素转成Int,这限定了转换的类型Int,最终产生的流为IntStream,及结果只能转化成int。

public class Main {

    public static void main(String[] args) {
         Stream.of("apple", "banana", "orange", "waltermaleon", "grape")
                .mapToInt(e -> e.length()) //转成int
                .forEach(e -> System.out.println(e));
    }
}

 

mapToInt如图:

mapToLong、mapToDouble 与mapToInt 类似。

  • flatmap 作用就是将元素拍平拍扁 ,将拍扁的元素重新组成Stream,并将这些Stream 串行合并成一条Stream
public class Main {

    public static void main(String[] args) {
        Stream.of("a-b-c-d","e-f-i-g-h")
                .flatMap(e->Stream.of(e.split("-")))
                .forEach(e->System.out.println(e));

    }
}

 

flatmap 如图:

  • flatmapToInt、flatmapToLong、flatmapToDouble 跟flatMap 都类似的,只是类型被限定了,这里就不在举例子了。

  • limit 限制元素的个数,只需传入 long 类型 表示限制的最大数

public class Main {

    public static void main(String[] args) {
        Stream.of(1,2,3,4,5,6)
                .limit(3) //限制三个
                .forEach(e->System.out.println(e)); //将输出 前三个 1,2,3
    }
}

 

limit如图:

  • filter 对某些元素进行过滤,不符合筛选条件的将无法进入流的下游
public class Main {

    public static void main(String[] args) {
        Stream.of(1,2,3,1,2,5,6,7,8,0,0,1,2,3,1)
                .filter(e->e>=5) //过滤小于5的
                .forEach(e->System.out.println(e));
    }
}

 

  • peek 挑选 ,将元素挑选出来,可以理解为提前消费
public static void main(String[] args) {

    User w = new User("w",10);
    User x = new User("x",11);
    User y = new User("y",12);

    Stream.of(w,x,y)
        .peek(e->{e.setName(e.getAge()+e.getName());}) //重新设置名字 变成 年龄+名字
        .forEach(e->System.out.println(e.toString()));

}

peek 如图:

  • skip 跳过 元素
public class Main {

    public static void main(String[] args) {
        Stream.of(1,2,3,4,5,6,7,8,9)
                .skip(4) //跳过前四个
                .forEach(e->System.out.println(e)); //输出的结果应该只有5,6,7,8,9
    }
}

 

  • collect 收集,使用系统提供的收集器可以将最终的数据流收集到List,Set,Map等容器中。

这里我使用collect 将元素收集到一个list中

public class Main {

    public static void main(String[] args) {
        Stream.of("apple", "banana", "orange", "waltermaleon", "grape")
                .collect(Collectors.toList()) //list容器
                .forEach(e -> System.out.println(e));
    }
}

 

不是说终止操作符只能使用一次吗,为什么这里调用了forEach 呢?forEach不仅仅是是Stream 中得操作符还是各种集合中得一个语法糖。

public class Main {

    public static void main(String[] args) {
        
        List<String> stringList = Stream.of("apple", "banana", "orange", "waltermaleon", "grape")
                .collect(Collectors.toList()); //收集的结果就是list
        stringList.forEach(e->System.out.println(e)); list的语法糖forEach
}

结果如图:

  • count 统计数据流中的元素个数,返回的是long 类型
public class Main {

    public static void main(String[] args) {

        long count = Stream.of("apple", "banana", "orange", "waltermaleon", "grape")
                .count();

        System.out.println(count);
    }
}

 

  • findFirst 获取流中的第一个元素
public class FindFirst {

    public static void main(String[] args) {
        Optional<String> stringOptional = Stream.of("apple", "banana", "orange", "waltermaleon", "grape")
                .findFirst();  //这里找到第一个元素 apple
        stringOptional.ifPresent(e->System.out.println(e));
    }
}

 

  • noneMatch 数据流中得没有一个元素与条件匹配的

这里 的作用是是判断数据流中 一个都没有与aa 相等元素 ,但是流中存在 aa ,所以最终结果应该是false

public class NoneMatch {

    public static void main(String[] args) {
        boolean result = Stream.of("aa","bb","cc","aa")
                .noneMatch(e->e.equals("aa"));
        System.out.println(result);
    }
}

 

  • allMatch和anyMatch 一个是全匹配,一个是任意匹配 和noneMatch 类似,这里就不在举例了。
  • min 最小的一个,传入比较器,也可能没有(如果数据流为空)
public class Main {

    public static void main(String[] args) {

        Optional<Integer> integerOptional = Stream.of(0,9,8,4,5,6,-1)
                .min((e1,e2)->e1.compareTo(e2));

        integerOptional.ifPresent(e->System.out.println(e));

    }

 

  • max 元素中最大的,需要传入比较器,也可能没有(流为Empty时)
public class Main {

    public static void main(String[] args) {

        Optional<Integer> integerOptional = Stream.of(0,9,8,4,5,6,-1)
                .max((e1,e2)->e1.compareTo(e2));

        integerOptional.ifPresent(e->System.out.println(e));

    }
}

 

  • reduce 是一个规约操作,所有的元素归约成一个,比如对所有元素求和,乘啊等。

这里实现了一个加法,指定了初始化的值

public class Main {
    public static void main(String[] args) {

        int sum = Stream.of(0,9,8,4,5,6,-1)
              .reduce(0,(e1,e2)->e1+e2);
        System.out.println(sum);  //31
    }
}

 

  • toArray 转成数组,可以提供自定义数组生成器
public class ToArray {
    public static void main(String[] args) {
        Object[] objects=Stream.of(0,2,6,5,4,9,8,-1)
                .toArray();

        for (int i = 0; i < objects.length; i++) {
            System.out.println(objects[i]);
        }
    }
}

 

Collectors

Collectors是一个工具类,是JDK预实现Collector的工具类,它内部提供了多种Collector,我们可以直接拿来使用,非常方便。

  • toCollection

将流中的元素全部放置到一个集合中返回,这里使用Collection,泛指多种集合。

List<String> list = Arrays.asList("123","456","789","1101","212121121","asdaa","3e3e3e","2321eew");
List<String> ll = list.stream().collect(Collectors.toCollection(LinkedList::new));
  • toList

List<String> list = Arrays.asList("123","456","789","1101","212121121","asdaa","3e3e3e","2321eew");
List<String> ll = list.stream().collect(Collectors.toList());
  • toSet

List<String> list = Arrays.asList("123","456","789","1101","212121121","asdaa","3e3e3e","2321eew");
Set<String> ss = list.stream().collect(Collectors.toSet());
  • joining

 joining的目的是将流中的元素全部以字符序列的方式连接到一起,可以指定连接符,甚至是结果的前后缀。

List<String> list = Arrays.asList("123","456","789","1101","212121121","asdaa","3e3e3e","2321eew");
// 无参方法
String s = list.stream().collect(Collectors.joining());
System.out.println(s);
// 结果:1234567891101212121121asdaa3e3e3e2321eew
// 指定连接符
String ss = list.stream().collect(Collectors.joining("-"));
System.out.println(ss);
// 结果:123-456-789-1101-212121121-asdaa-3e3e3e-2321eew
// 指定连接符和前后缀
String sss = list.stream().collect(Collectors.joining("-","S","E"));
System.out.println(sss);
// 结果:S123-456-789-1101-212121121-asdaa-3e3e3e-2321eewE
  •  mapping

这个映射是首先对流中的每个元素进行映射,即类型转换,然后再将新元素以给定的Collector进行归纳。

List<String> list = Arrays.asList("123","456","789","1101","212121121","asdaa","3e3e3e","2321eew");
List<Integer> ll = list.stream().limit(5).collect(Collectors.mapping(Integer::valueOf,Collectors.toList()));

实例中截取字符串列表的前5个元素,将其分别转换为Integer类型,然后放到一个List中返回。

  • collectingAndThen

该方法是在归纳动作结束之后,对归纳的结果进行再处理。

List<String> list = Arrays.asList("123","456","789","1101","212121121","asdaa","3e3e3e","2321eew");
int length = list.stream().collect(Collectors.collectingAndThen(Collectors.toList(),e -> e.size()));
  • counting

该方法用于计数。

List<String> list = Arrays.asList("123","456","789","1101","212121121","asdaa","3e3e3e","2321eew");
long size = list.stream().collect(Collectors.counting());
  • minBy/maxBy

生成一个用于获取最小/最大值的Optional结果的Collector。

List<String> list = Arrays.asList("123","456","789","1101","212121121","asdaa","3e3e3e","2321eew");
System.out.println(list.stream().collect(Collectors.maxBy((a,b) -> a.length()-b.length())));
// 输出结果:Optional[212121121]
System.out.println(list.stream().collect(Collectors.minBy((a,b) -> a.length()-b.length())));
// 输出结果:Optional[123]
  • summingInt/summingLong/summingDouble

生成一个用于求元素和的Collector,首先通过给定的mapper将元素转换类型,然后再求和。

参数的作用就是将元素转换为指定的类型,最后结果与转换后类型一致。

List<String> list = Arrays.asList("123","456","789","1101","212121121","asdaa","3e3e3e","2321eew");
int i = list.stream().limit(3).collect(Collectors.summingInt(Integer::valueOf));
// 结果:1368
long l = list.stream().limit(3).collect(Collectors.summingLong(Long::valueOf));
// 结果:1368
double d = list.stream().limit(3).collect(Collectors.summingDouble(Double::valueOf));
// 结果:1368.0
  • groupingBy

这个方法是用于生成一个拥有分组功能的Collector。

List<String> list = Arrays.asList("123","456","789","1101","212121121","asdaa","3e3e3e","2321eew");
Map<Integer,List<String>> s = list.stream().collect(Collectors.groupingBy(String::length));
// 结果:{3=[123, 456, 789], 4=[1101], 5=[asdaa], 6=[3e3e3e], 7=[2321eew], 9=[212121121]}
Map<Integer,List<String>> ss = list.stream().collect(Collectors.groupingBy(String::length, Collectors.toList()));
// 结果:{3=[123, 456, 789], 4=[1101], 5=[asdaa], 6=[3e3e3e], 7=[2321eew], 9=[212121121]}
Map<Integer,Set<String>> sss = list.stream().collect(Collectors.groupingBy(String::length,HashMap::new,Collectors.toSet()));
// 结果:{3=[123, 456, 789], 4=[1101], 5=[asdaa], 6=[3e3e3e], 7=[2321eew], 9=[212121121]}
  • partitioningBy

该方法将流中的元素按照给定的校验规则的结果分为两个部分,放到一个map中返回,map的键是Boolean类型,值为元素的列表List。

List<String> list = Arrays.asList("123","456","789","1101","212121121","asdaa","3e3e3e","2321eew");
Map<Boolean,List<String>> map = list.stream().collect(Collectors.partitioningBy(e -> e.length()>5));
// 结果:{false=[123, 456, 789, 1101, asdaa], true=[212121121, 3e3e3e, 2321eew]}
Map<Boolean,Set<String>> map2 = list.stream().collect(Collectors.partitioningBy(e -> e.length()>6,Collectors.toSet()));
// 结果:{false=[123, 456, 1101, 789, 3e3e3e, asdaa], true=[212121121, 2321eew]}
  • summarizingInt/summarizingLong/summarizingDouble

这三个方法适用于汇总的,返回值分别是IntSummaryStatistics,LongSummaryStatistics,DoubleSummaryStatistics。

在这些返回值中包含有流中元素的指定结果的数量、和、最大值、最小值、平均值。所有仅仅针对数值结果。

List<String> list = Arrays.asList("123","456","789","1101","212121121","asdaa","3e3e3e","2321eew");
IntSummaryStatistics intSummary = list.stream().collect(Collectors.summarizingInt(String::length));
// 结果:IntSummaryStatistics{count=8, sum=40, min=3, average=5.000000, max=9}
LongSummaryStatistics longSummary = list.stream().limit(4).collect(Collectors.summarizingLong(Long::valueOf));
// 结果:LongSummaryStatistics{count=4, sum=2469, min=123, average=617.250000, max=1101}
DoubleSummaryStatistics doubleSummary = list.stream().limit(3).collect(Collectors.summarizingDouble(Double::valueOf));
// 结果:DoubleSummaryStatistics{count=3, sum=1368.000000, min=123.000000, average=456.000000, max=789.000000}

 

整个Collectors工具类就是在为Collector服务,用于创建各种不同的Collector。部分功能与Stream中的方法重合了,为了简化代码,完全不必采用Collectors实现,优先Stream方法。

 

实例应用

抽取一个对象数组electricFenceVehicleList的id属性组合成id数组

List<Long> idList = electricFenceVehicleList.stream().map(ElectricFenceVehicle::getId).collect(Collectors.toList());

 

根据对象中的gender属性的值,为genderStr设置不同的值(gender=0设置为男,gender1设置为女)

List<VehDriver> driverList = vehDriverServiceClient.listAll(vehDriver);
driverList.stream().peek(e->{if(e.getGender()==0){
        e.setGenderStr("男");
    }else if(e.getGender()==1){
        e.setGenderStr("女");
    }else{
        e.setGenderStr("");
    }}).collect(Collectors.toList());

 

有一个id的集合driverIdList,还有一个对象集合vehDrivers ,排除对象的id属性包含在driverIdList中的对象并返回过滤后的集合

// 获取司机列表
List<VehDriver> vehDrivers = selectVehDriverList(vehDriverParam);
// 根据车辆id查询已绑定的司机id列表
List<Long> driverIdList = getDriverIds(vehDriverParam.getVehicleId());
//排除id属性包含在driverIdList 中的对象
if(!driverIdList.isEmpty()){
    return vehDrivers.stream().filter(e-> !driverIdList.contains(e.getId())).collect(Collectors.toList());
}

 

抽取对象集合的属性并以逗号隔开

Object[] objects = studentList.stream().map(Student::getName).toArray();
String nameData = StringUtils.join(objects, ",");

 

计算对象集合某个属性的和

List<String> offlineNumList = vehicleOfflineResultList.stream().map(VehicleOfflineResult::getOfflineNum).collect(Collectors.toList());
long totalOfflineNum = offlineNumList.stream().mapToLong(Long::valueOf).sum();

 

posted on 2021-01-23 20:29  FuYingju  阅读(858)  评论(0编辑  收藏  举报