详解Java中Collector接口的组成
一、Collector常常出现的地方
java8引入了stream,Collector是与stream一起出现的,配合stream使用的好帮手,如果用过stream,我们应该都有写过这样的代码
例子1:
lists.stream()....collect(Collectors.toList());
例子2:
lists.stream().collect(groupingBy(String::length));
这两个例子中,toList()和groupingBy()返回的都是一个Collector对象,那么问题来了,什么是Collector?
二、什么是Collector
Collector其实是一个泛型接口,通过这个接口可以定义一系列的聚合操作,按照官方文档的说法,Collector其实是提供mutable reduction operation,即可改变的减少操作。
常见的聚合操作有:
1.用StringBuilder拼接字符串
2.计算元素综合的数据,比如sum, min, max, or average
这个reduction在Google翻译是减少的意思,但是我不太对得上这个意思,觉得形容成聚合操作会更容易理解一点。
关于聚合操作,我们会在很多语言中遇到,比如mysql里面的group by操作,sum(),min(),max(),Count(),anyValue(),这些叫做aggregate function,即聚合操作
我理解这些操作的是类似的,只不过这些是在数据库里面进行的,collector是在java代码层进行的,他们的本质都是一样的,他们都进行了多对一的转换,将一系列的数据变成一个数据或者几团数据。
三、Collector的使用
Collector是一个接口,它还有一个静态工具类Collectors,Collectors提供了很多常见的聚合操作的实现,通常来说我们调用Collectors里面的方法就够了,如果想要更多更复杂的实现也可以自定义一个collector,定义Collector的话,我们需要先了解Collector的组成
3.1 Collector的泛型类型
collector是一个泛型接口,那我们先从泛型的元素开始分析
Collector<T, A, R>
这个接口有三种类型,T代表流中元素的类型,A是中间结果容器的类型,R是最后返回的类型
比如一个字符串数组strings,对它进行这个操作
strings.stream()....collect(Collectors.toList());
toList()方法返回的Collector中,T就是String类型,A是List<String>类型,R是List<String>类型,如果不能理解可以继续往下看
3.2 Collector 的组成
collector由四个方法组成和一个特性组成
组成 | 作用 |
---|---|
Supplier | 创建一个新的结果容器 |
accumulator | 将一个新的元素(流中的元素)加入到结果容器中 |
combiner | 接受两个中间的结果容器,将它们合并成一个(并行流的时候) |
finisher | 将结果容器转换成另一个类型(可选的) |
characteristics 是一个枚举特性集合,决定某些操作过程的特性,比如是否是并行的,是否需要转换结果容器,是否是有序的,这些特性用来进行简化操作,提供更好的性能。
一共有三个特性,在定义的时候可以选几个来组成这个集合,它们是:
- CONCURRENT :意味着这个同一个容器可以被多个线程调用accumulator方法进行操作
- UNORDERED:意味着这个聚合操作不会保留元素的出现顺序,一般是来说最后的结果容器是无序的(比如Set)才会使用
- IDENTITY_FINISH:意味着finisher方法是Function.identity(),可以被省略,如果设置了的话,需要A类型可以能强制地转换成R类型,否则会抛出异常。
关于Collector的四个方法,这里用一个流程图来解释这个过程
3.3 举例解释Collector四个方法
下面通过Collectors里面提供的常见方法来详细地说明Collector的组成
3.3.1 Example1- toList()
首先来看toList()方法的组成
public static <T> Collector<T, ?, List<T>> toList() { return new CollectorImpl<>((Supplier<List<T>>) ArrayList::new, List::add, (left, right) -> { left.addAll(right); return left; }, CH_ID); }
对于这个方法实现来说
- supplier是 () -> ArrayList::new,提供的容器类型(A)是ArrayList
- accumulator是List::add,将元素item加入到arrayList容器中,即
(intermediateCollector, item) -> intermediateCollector.add(item)
- combiner是将两个容器arrayList合并
(left, right) -> { left.addAll(right); return left;}
- finisher是啥也不做,combiner之后的结果就直接返回来,所以R也是ArrayList的类型
- characteristic是
Collections.unmodifiableSet(EnumSet.of(Collector.Characteristics.IDENTITY_FINISH));
IDENTITY_FINISH这个特性是说,不执行finisher函数,直接返回combiner之后的结果容器
3.3.2 Example2- joining()
joining有三个方法重载,我们这里先看最直观的一个,它的实现是
public static Collector<CharSequence, ?, String> joining() { return new CollectorImpl<CharSequence, StringBuilder, String>( StringBuilder::new, StringBuilder::append, (r1, r2) -> { r1.append(r2); return r1; }, StringBuilder::toString, CH_NOID); }
- supplier是StringBuilder::new,即:
() -> new StringBuilder();
容器A的类型是StringBuilder
- accumulator是StringBuilder::append, 即
(intermediate, current)-> intermediare.append(current);
- combiner是
(r1, r2) -> { r1.append(r2); return r1; }
即对于两个中间的结果stringBuilder来说,combiner做的事情就是合并两个stringBuilder,变成一个stringBuilder
- finisher是StringBuilder::toString,对于最后的容器StringBuilder,finisher会将它转换成String的类型,因此R的类型是String
- characteristic是一个emptySet(),不包含任何特性
Collections.emptySet();
到此这篇关于详解Java中Collector接口的组成的文章就介绍到这了,更多相关Collector接口的组成内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!