浅谈JAVA8给我带了什么——流的概念和收集器

到现在为止,笔者不敢给流下定义,从概念来讲他应该也是一种数据元素才是。可是在我们前面的代码例子中我们可以看到他更多的好像在表示他是一组处理数据的行为组合。这让笔者很难去理解他的定义。所以笔者不表态。各位同志自行理解吧。

在没有流以前,处理集合里面的数据一般都会用到显示的迭代器。用一下前面学生的例子吧。目标是获得学分大于5的前俩位同学。

package com.aomi;

import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;
import static java.util.stream.Collectors.toList;

public class Main {

 public static void main(String[] args) {
  // TODO Auto-generated method stub

  List<Student> stus = getSources();

  Iterator<Student> ite = stus.iterator();

  List<String> names = new ArrayList<>();
  int limit = 2;
  while (ite.hasNext() && limit > 0) {

   Student stu = ite.next();

   if (stu.getScore() > 5) {

    names.add(stu.getName());
    limit--;
   }
  }

  for (String name : names) {
   System.out.println(name);
  }

 }

 public static List<Student> getSources() {
  List<Student> students = new ArrayList<>();

  Student stu1 = new Student();

  stu1.setName("lucy");
  stu1.setSex(0);
  stu1.setPhone("13700227892");
  stu1.setScore(9);

  Student stu2 = new Student();
  stu2.setName("lin");
  stu2.setSex(1);
  stu2.setPhone("15700227122");
  stu2.setScore(9);

  Student stu3 = new Student();
  stu3.setName("lili");
  stu3.setSex(0);
  stu3.setPhone("18500227892");
  stu3.setScore(8);

  Student stu4 = new Student();

  stu4.setName("dark");
  stu4.setSex(1);
  stu4.setPhone("16700555892");
  stu4.setScore(6);

  students.add(stu1);
  students.add(stu2);
  students.add(stu3);
  students.add(stu4);

  return students;
 }

}

如果用流的话是这样子的。

public static void main(String[] args) {
  // TODO Auto-generated method stub

  List<Student> stus = getSources();

  List<String> names = stus.stream()
    .filter(st -> st.getScore() > 5)
    .limit(2)
    .map(st -> st.getName())
    .collect(toList());
  for (String name : names) {
   System.out.println(name);
  }

 }

把这俩段代码相比较主要是为了说明一个概念:以前做法都是在外部迭代,最为体现就是笔者在外面定义了一个集合names 。而流却什么也没有,现在我们应该能清楚感受到流是在内部迭代。也就是说流已经帮你做好了迭代。我们只要传入相关的函数就可以得到想要的结果。至于内部迭代的好处,笔者没有办法亲身的感受,唯一的感觉就是代码变的简单明了了。但是官方说Stream库为了我们在内部迭代里面做了很多优化和充公利用性能的操作。比如并行操作。所以笔者就听官方了。

事实上,在用流的过程中,我们用到很多方法函数。比如上面的limit方法,filter方法等。这个定义为流操作。但是不管是什么操作,你必须要有一个数据源吧。总结如下:

  1. 数据源:用于生成流的数据,比如集合。
  2. 流操作:类似于limit方法,filter方法。

流还有一种特点——部分流操作是没有执行的。一般都是在collect函数执行的时候,才开始执行个个函数。所以我们可以细分一下流操作:

  1. 数据源:用于生成流的数据,比如集合。
  2. 中间操作:类似于limit方法,filter方法。这些操作做变了一个操作链,有一点流水线的概念。
  3. 终端操作:执行上面的操作链。比如collect函数。

从上面的讲解我们就可以感觉流好像是先收集相关的目标操作,什么意思呢?就是先把要做的事情计划一下,最后一声令下执行。而下这个命令是collect函数。这一点跟.NET的Linq是很像的。同时记得他只能执行一次。也就是说这个流执行一次之后,就不可能在用了。
笔者列一下以前的用到的函数

forEach:终端
collect:终端
count:终端
limit:中间
filter:中间
map:中间
sorted:中间

到目前为止我们用到的流都是通过集合来建一个流。笔者对此从来没有讲过。现在笔者来讲些构建流的方式。
在stream库里面为我们提供了这样子一个方法——Stream.of

package com.aomi;

import java.util.Optional;
import java.util.stream.Stream;

public class Main {

	public static void main(String[] args) {
		// TODO Auto-generated method stub

		Stream stream = Stream.of("I", "am", "aomi");

		Optional<String> firstWord = stream.findFirst();

		if(firstWord.isPresent())
		{
			System.out.println("第一个字:"+firstWord.get());
		}
	}

}

运行结果:

去看一下of方法的代码。如下

public static<T> Stream<T> of(T... values) {
  return Arrays.stream(values);
 }

说明我们可能指定一个类型来建一个流。上面可以修改为

Stream<String> stream = Stream.of("I", "am", "aomi");

findFirst函数用于表示返回第一个值。那就是可能数据源是一个空呢?所以他有可以会返回null。所以就是用一个叫Optional类的表示可以为空。这样子我们就可以用Optional类的方法进一步做安全性的操作。比如判断有没有值(isPresent())
笔者想要建一个int类型的数组流玩玩。为了方便笔者便试给一下上面的代码。却发现报错了。

如果我把int改为Integer呢?没有问题了。所以注意要用引用类型的。int类型对应为Integer类型。

package com.aomi;

import java.util.Optional;
import java.util.stream.Stream;

public class Main {

 public static void main(String[] args) {
  // TODO Auto-generated method stub

  Stream<Integer> stream = Stream.of(1, 2, 9);

  Optional<Integer> firstWord = stream.findFirst();

  if(firstWord.isPresent())
  {
   System.out.println("第一个字:"+firstWord.get());
  }

 }

}

运行结果:

那想要用int类型呢?什么办呢?改改

package com.aomi;

import java.util.OptionalInt;
import java.util.stream.IntStream;

public class Main {

 public static void main(String[] args) {
  // TODO Auto-generated method stub

  IntStream stream = IntStream.of(1, 2, 9);

  OptionalInt firstWord = stream.findFirst();

  if(firstWord.isPresent())
  {
   System.out.println("第一个字:"+firstWord.getAsInt());
  }

 }

}

运行结果:

我们以上面的例子来一个猜测:是不是Double类型,只要修改为DoubleStream就行呢?试试。

package com.aomi;

import java.util.OptionalDouble;
import java.util.stream.DoubleStream;

public class Main {

 public static void main(String[] args) {
  // TODO Auto-generated method stub

  DoubleStream stream = DoubleStream.of(1.3, 2.3, 9.5);

  OptionalDouble firstWord = stream.findFirst();

  if(firstWord.isPresent())
  {
   System.out.println("第一个字:"+firstWord.getAsDouble());
  }

 }

}

运行结果:

结果很明显,我们的猜测是对的。所以见意如果你操作的流是一个int或是double的话,请进可能的用XxxStream 来建流。这样子在流的过程中不用进行拆装和封装了。必竟这是要性能的。在看一下如果数据源是一个数组的情况我们如何生成流呢?

public static Collector<CharSequence, ?, String> joining(CharSequence delimiter,
                CharSequence prefix,
                CharSequence suffix) {
  return new CollectorImpl<>(
    () -> new StringJoiner(delimiter, prefix, suffix),
    StringJoiner::add, StringJoiner::merge,
    StringJoiner::toString, CH_NOID);
 }

在看一个叫toList函数的代码。

public static <T>
 Collector<T, ?, List<T>> toList() {
   return new CollectorImpl<>((Supplier<List<T>>) ArrayList::new, List::add,
         (left, right) -> { left.addAll(right); return left; },
         CH_ID);
 }

我们发现他会共同的返回一个Collector类型。从上面我们就可以知道他的任务就是用去处理最后数据。我们把他定为收集器。让我们看一下收集器的接口代码吧;

public interface Collector<T, A, R> {

 Supplier<A> supplier();

 BiConsumer<A, T> accumulator();

 BinaryOperator<A> combiner();

 Function<A, R> finisher();

 Set<Characteristics> characteristics();
}

光看前面四个方法是不是有一点熟悉的感觉。想要说明这个五个方法的作用。就必须明白一个概念——并行归约。前面笔者讲过流是一个内部迭代,也说Stream库为我们做一个很多优化的事情。其中一个就是并行。他用到了JAVA 7引入的功能——分支/合并框架。也就是说流会以递归的方式拆分成很多子流,然后子流可以并行执行。最后在俩俩的子流的结果合并成一个最终结果。而这俩俩合并的行为就叫归约 。如图下。引用于《JAVA8实战》

我们必须根据图上的意思来走。子流的图里面会调用到Collector类的三个方法。

  1. supplier方法:用创建数据存储的地方。
  2. accumulator方法:用于子流执行过程的迭代工作。即是遍历每一项都会执行。所以可以这里做一些工作。
  3. finisher方法:返回最后的结果,你可以在这里进一步处理结果。

每一个子流结束这之后,就是俩俩合并。这个时候就要看流的机制图了。

  1. combiner方法:会传入每一个子流的结果过来,我们就可以在这里在做一些工作。
  2. finisher方法:返回最后的结果。同上面子流的一样子。

好像没有characteristics什么事情。不是这样子的。这个方法是用来说明当前这个流具备哪些优化。这样子执行流的时候,就可以很清楚的知道要以什么样子的方式执行了。比如并行。
他是一个enum类。值如下

  1. UNORDERED:这个表示执行过程中结果不受归约和遍历的影响
  2. CONCURRENT:表示可以多个线和调用accumulator方法。并且可以执行并行。当然前无序数据的才并行。除非收集器标了UNORDERED。
  3. IDENTITY_FINISH:表示这是一个恒等函数,就是做了结果也一样子。不用做了可以跳过了。

由了上面的讲说明,我们在来写一个自己的收集器吧——去除相同的单词
DistinctWordCollector类:

package com.aomi;

import java.util.ArrayList;
import java.util.Collections;
import java.util.EnumSet;
import java.util.List;
import java.util.Set;
import java.util.function.BiConsumer;
import java.util.function.BinaryOperator;
import java.util.function.Function;
import java.util.function.Supplier;
import java.util.stream.Collector;

public class DistinctWordCollector implements Collector<String, List<String>, List<String>> {

 @Override
 public Supplier<List<String>> supplier() {
  // TODO Auto-generated method stub
  return () -> new ArrayList<String>();
 }

 /**
  * 子流的处理项的过程
  */
 @Override
 public BiConsumer<List<String>, String> accumulator() {
  // TODO Auto-generated method stub
  return (List<String> src, String val) -> {

   if (!src.contains(val)) {
    src.add(val);
   }
  };
 }

 /**
  * 俩俩并合的执行函数
  */
 @Override
 public BinaryOperator<List<String>> combiner() {
  // TODO Auto-generated method stub
  return (List<String> src1, List<String> src2) -> {
   for (String val : src2) {
    if (!src1.contains(val)) {
     src1.add(val);
    }
   }
   return src1;
  };
 }

 @Override
 public Function<List<String>, List<String>> finisher() {
  // TODO Auto-generated method stub
  return Function.identity();
 }

 @Override
 public Set<Characteristics> characteristics() {
  // TODO Auto-generated method stub
  return Collections.unmodifiableSet(EnumSet.of(Characteristics.IDENTITY_FINISH, Characteristics.CONCURRENT));
 }

}

Main:

public static void main(String[] args) {
  // TODO Auto-generated method stub

  List<String> words = Arrays.asList("aomi","lili","lucy","aomi","Nono");

  List<String> vals = words.stream().collect(new DistinctWordCollector());

  for (String val : vals) {
   System.out.println(val);
  }
 }

运行结果

结果确定就是我们想要的——去掉了重复的aomi

以上所述是小编给大家介绍的JAVA8流的概念和收集器详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我们网站的支持!

(0)

相关推荐

  • Java8新特性Stream流实例详解

    什么是Stream流? Stream流是数据渠道,用于操作数据源(集合.数组等)所生成的元素序列. Stream的优点:声明性,可复合,可并行.这三个特性使得stream操作更简洁,更灵活,更高效. Stream的操作有两个特点:可以多个操作链接起来运行,内部迭代. Stream可分为并行流与串行流,Stream API 可以声明性地通过 parallel() 与sequential() 在并行流与顺序流之间进行切换.串行流就不必再细说了,并行流主要是为了为了适应目前多核机器的时代,提高系统CP

  • 详解java8中的Stream数据流

    Stream是java8引入的一个重度使用lambda表达式的API.Stream使用一种类似用SQL语句从数据库查询数据的直观方式来提供一种对Java集合运算和表达的高阶抽象.直观意味着开发者在写代码时只需关注他们想要的结果是什么而无需关注实现结果的具体方式.这一章节中,我们将介绍为什么我们需要一种新的数据处理API.Collection和Stream的不同之处以及如何将StreamAPI应用到我们的编码中. 筛选重复的元素 Stream 接口支持 distinct 的方法, 它会返回一个元素

  • Java8中流的性能及流的几个特性

    摘要:本文介绍了Java8中流的几个特性,以告诫开发者流并不是高性能的代名词,需谨慎使用流.以下是译文. 流(Stream)是Java8为了实现最佳性能而引入的一个全新的概念.在过去的几年中,随着硬件的持续发展,编程方式已经发生了巨大的改变,程序的性能也随着并行处理.实时.云和其他一些编程方法的出现而得到了不断提高. Java8中,流性能的提升是通过并行化(parallelism).惰性(Laziness)和短路操作(short-circuit operations)来实现的.但它也有一个缺点,

  • Java8中使用流方式查询数据库的方法

    由于关系型数据库操作语言和面向对象语言之间的差异,如今我们仍然需要花费许多时间建立数据库与 Java 应用之间互相沟通的桥梁.通常,我们可以编写自己的映射层(mapping layer),或者使用第三方的 ORM(Object Relational Mapper)对象关系映射框架,比如 Hibernate.ORM 框架虽然使用起来很方便,但是如何正确地配置和提高框架操作数据库的性能却不太容易,ORM 框架往往会使我们的应用性能下降. 最近,我贡献了一个新的开源项目--Speedment,它能使我

  • 浅谈JAVA8给我带了什么——流的概念和收集器

    到现在为止,笔者不敢给流下定义,从概念来讲他应该也是一种数据元素才是.可是在我们前面的代码例子中我们可以看到他更多的好像在表示他是一组处理数据的行为组合.这让笔者很难去理解他的定义.所以笔者不表态.各位同志自行理解吧. 在没有流以前,处理集合里面的数据一般都会用到显示的迭代器.用一下前面学生的例子吧.目标是获得学分大于5的前俩位同学. package com.aomi; import java.util.ArrayList; import java.util.Iterator; import j

  • 浅谈java8中map的新方法--replace

    Map在Java8中新增了两个replace的方法 1.replace(k,v) 在指定的键已经存在并且有与之相关的映射值时才会将指定的键映射到指定的值(新值) 在指定的键不存在时,方法会return回来一个null javadoc的注释解释了该默认值方法的实现的等价Java代码: if (map.containsKey(key)) { return map.put(key, value); } else { return null; } 下面展示的是新方法和JDK8之前的方法比较: /* *

  • 浅谈layui框架自带分页和表格重载的接口解析问题

    首先要了解框架分页自带的参数有哪些,特别是注意参数名称要和后台一致! **需要注意的是layui框架的数据解析格式问题,data必须是个数组对象的形式才能正常解析否则会很麻烦(亲测过非正常解析,手写js手动动态添加表格) data 格式例如: { "count": 11, "code": 0, "msg": "", "data": [ { "id": "1", &qu

  • 浅谈java8 stream flatMap流的扁平化操作

    概念: Steam 是Java8 提出的一个新概念,不是输入输出的 Stream 流,而是一种用函数式编程方式在集合类上进行复杂操作的工具.简而言之,是以内部迭代的方式处理集合数据的操作,内部迭代可以将更多的控制权交给集合类.Stream 和 Iterator 的功能类似,只是 Iterator 是以外部迭代的形式处理集合数据的操作. 在Java8以前,对集合的操作需要写出处理的过程,如在集合中筛选出满足条件的数据,需要一 一遍历集合中的每个元素,再把每个元素逐一判断是否满足条件,最后将满足条件

  • 浅谈Java8新特性Predicate接口

    一.前言 Java 8中引入了Predicate功能接口. Java Predicate表示一个参数的谓词. Predicate是一个布尔值的函数. Java Predicate是一个功能接口,属于java.util.function包. Predicate的功能方法是test(T t). Predicate的其他方法是test.isEqual.and.or.negate和not. not方法在Java 11中被引入. 在本文章,我们将提供Predicate的例子及其所有方法. 二.test(T

  • 浅谈Java8 判空新写法

    目录 引言 API介绍 1.Optional(),empty(),of(),ofNullable() 2.orElse(),orElseGet()和orElseThrow() 3.map()和flatMap() 4.isPresent()和ifPresent(Consumer<? super T> consumer) 5.filter(Predicate<? super T> predicate) 实战 例一 例二 例三 引言 在开发过程中很多时候会遇到判空校验,如果不做判空校验则

  • 浅谈Java8对字符串连接的改进正确姿势

    我们提出一个需求:有一个 List<String>,将其格式化为 元素1, 元素2, 元素3, ... 元素N 的字符串形式. 毋庸置疑, Java8 之前我们的第一反应是使用 StringBuilder : public static String formatList(List<String> list, String delimiter) { StringBuilder result = new StringBuilder(); for (String str : list)

  • 浅谈Java8 的foreach跳出循环break/return

    java8中跳出循环不能使用break? 通过测试发现: 对于java8中的特殊写法lamada表达式中,不能使用break,会提示错误; java8中使用return,会跳出当前循环,继续下一次循环,作用类似continue; java8中使用foreach,但是不是lamada表达式写法,可以正常使用break或者return,可以直接跳出循环. public class TestForEachJava8 { public static void main(String[] args) {

  • 浅谈带缓冲I/O 和不带缓冲I/O的区别与联系

    这里搜集从网上看到的一些言论,自认为还是比较靠谱的,有些不靠谱的根据自己的理解进行了修正. 首先要明白不带缓冲的概念:所谓不带缓冲,并不是指内核不提供缓冲,而是只单纯的系统调用,不是函数库的调用.系统内核对磁盘的读写都会提供一个块缓冲(在有些地方也被称为内核高速缓存),当用write函数对其写数据时,直接调用系统调用,将数据写入到块缓冲进行排队,当块缓冲达到一定的量时,才会把数据写入磁盘.因此所谓的不带缓冲的I/O是指进程不提供缓冲功能(但内核还是提供缓冲的).每调用一次write或read函数

  • 浅谈Python中带_的变量或函数命名

    Python 的代码风格由 PEP 8 描述.这个文档描述了 Python 编程风格的方方面面.在遵守这个文档的条件下,不同程序员编写的 Python 代码可以保持最大程度的相似风格.这样就易于阅读,易于在程序员之间交流. python中的标识符可以包含数字.字母和_,但必须以字母或者_开头,其中以_开头的命名一般具有特殊的意义. 前后均带有双下划线__的命名 一般用于特殊方法的命名,用来实现对象的一些行为或者功能,比如__new__()方法用来创建实例,__init__()方法用来初始化对象,

随机推荐