java8学习之收集器用法详解与多级分组和分区
收集器用法详解:
在上次已经系统的阅读了Collector收集器的Javadoc对它已经有一个比较详细的认知了,但是!!!它毕境是只是一个接口,要使用的话还得用它的实现类,所以在Java8中有它进行了实现,而且也只有唯一的一个实现,其实现类名叫:CollectorImpl,它在咱们已经使用过N次的Collectors类中,如下:
其把它的完整代码贴出来,如下:
/** * Simple implementation class for {@code Collector}. * * @param <T> the type of elements to be collected * @param <R> the type of the result */ static class CollectorImpl<T, A, R> implements Collector<T, A, R> { private final Supplier<A> supplier; private final BiConsumer<A, T> accumulator; private final BinaryOperator<A> combiner; private final Function<A, R> finisher; private final Set<Characteristics> characteristics; CollectorImpl(Supplier<A> supplier, BiConsumer<A, T> accumulator, BinaryOperator<A> combiner, Function<A,R> finisher, Set<Characteristics> characteristics) { this.supplier = supplier; this.accumulator = accumulator; this.combiner = combiner; this.finisher = finisher; this.characteristics = characteristics; } CollectorImpl(Supplier<A> supplier, BiConsumer<A, T> accumulator, BinaryOperator<A> combiner, Set<Characteristics> characteristics) { this(supplier, accumulator, combiner, castingIdentity(), characteristics); } @Override public BiConsumer<A, T> accumulator() { return accumulator; } @Override public Supplier<A> supplier() { return supplier; } @Override public BinaryOperator<A> combiner() { return combiner; } @Override public Function<A, R> finisher() { return finisher; } @Override public Set<Characteristics> characteristics() { return characteristics; } }
貌似相当简单呀,细看一下它的具体实现:
那思考一个问题:为什么该实现类被设计成了“static class” 静态内部类而不新做为一个类的文件存在呢?其实也不难理解,因为Collectors类类似一个工厂类来给开发者提供非常常见的Collector的实现,如:counting、minBy、maxBy、summingInt()、groupingBy等等,从它的构造设计就可以得知:
而由于每个方法都是完全依赖于Collector的具体实现CollectorImpl,如下:
因此直接将CollectorImpl就放到了Collectors类的里面了,只供它使用,其它类是不会使用CollectorImpl类的。
既然已经将源代码定格在了Collectors了,何不读一下它的javadoc呢?
那如果这里面提供的满足不了咱们的实际业务需求那怎么办呢?这时只能自己实现了,这个在未来会学习到,这里先抛出这个东东。
多级分组和分区:
接下来则用例子再一次加深对Collectors提供的核心方法的了解,继续用上一次【http://www.cnblogs.com/webor2006/p/8310369.html】已经使用过的例子如下:
下面以各种需求来展开代码实践:
①、从学生集合中找出来分数最低的那个学生,并将其学生实体打印出来。
那此时它返回的是一个什么类型的数据呢?
既然是返回的Optional,根据它的最佳实践得这样写:
那如果查询成绩最高的学生呢,依葫芦画瓢嘛:
那如果求平均值呢?so easy:
那请问下该计算最后返回的结果类型是?还是OptionInt么?很显然不是了,因为平均值默认就是0嘛,没有元素最终也会返回0,所以需要注意一下,下面打印一下:
接着求出分数的总合呢?
接着求出摘要信息,就是说可以看到求和,求平均的信息,之前也用过了,这里再复习一下:
②、将学生的名字拼接到一起输出出来:
接着连接时以","进行分割:
编译运行:
然后再进一步,给拼接的字符串加前后缀,如下:
编译运行:
③、groupingBy()和partitioningBy()拓展:
之前咱们已经用过这两个方法了,只是说当时只是一级分组,如下:
实际上这两个方法是可以支持多级分组和分区的,所以下面来使用一下,为了更好的表达,下面给集合中再增加一个学生数据:
然后先对学生的分数进行分组,这时如果一个组里有多个学生的话,再按学生的名字进行分组,那如何实现呢,看下面:
那请问该结果返回啥子类型?下面看下:
下面看下结果:
{80={zhangsan=[Student{name='zhangsan', score=80}]}, 100={wangwu=[Student{name='wangwu', score=100}]}, 90={lisi=[Student{name='lisi', score=90}], zhaoliu=[Student{name='zhaoliu', score=90}, Student{name='zhaoliu', score=90}]}}
接下来再来看一下分区,找出成绩大于80的学生在一个分区,以及小于80的学生在一个分区,比较简单,因为之前已经练过了,直接看代码:
{false=[Student{name='zhangsan', score=80}], true=[Student{name='lisi', score=90}, Student{name='wangwu', score=100}, Student{name='zhaoliu', score=90}, Student{name='zhaoliu', score=90}]}
继续,这次先对成绩是否大于80进行分区,接着再对分区之后的集合里面再对成绩是否大于90再一次进行分区,如何整呢?
那请问它的结果返回的类型是啥?下面看下:
{false={false=[Student{name='zhangsan', score=80}], true=[]}, true={false=[Student{name='lisi', score=90}, Student{name='zhaoliu', score=90}, Student{name='zhaoliu', score=90}], true=[Student{name='wangwu', score=100}]}}
那通过上面两个可以嵌套分区或分组是要说明一个什么问题呢?说明Collector设计成可组合的,也就是Collector时面还是可嵌套Collector,这个在Collector的javadoc上也进行了说明,如下:
接着进一步:除了分组里面可以继续分组、分区里面可以继续分区之外,在分组里面还可以用其它的一个Collector,下面看一个这样的例子:统计分数大于80的学生,然后进行分组,然后再计算每个组的一个总数量,看下面的做法:
下面继续变更需求:先根据学生的名字进行分组,然后得到组里学生分数最小的那个,具体做法如下:
那此时看它返回的结果类型:
但是!!这不是我们所期望的结果呀,对于有分组的元素肯定是不可能为空的,也就是只要有分组肯定里面的元素就一定有最小的学生,等于这个返回Optional对于咱们这个场景有点多余,那如何只返回Map<String,Student>这个类型而不返回Optional呢?简单能想到的方法当然是通过遍历这个结果然后再通过Optional.ifPresent()方法将其拿出来喽,但是!!实际有另外一个简单的办法,如何做呢?
编译运行:
{lisi=Student{name='lisi', score=90}, zhaoliu=Student{name='zhaoliu', score=90}, zhangsan=Student{name='zhangsan', score=80}, wangwu=Student{name='wangwu', score=100}}
从collectingAndThen这个方法的见名之义就可以知道它是先收集,收集完之后则干某件事,好好体会一下这种场景的这种用法。