Java8中流的性能及流的几个特性

摘要:本文介绍了Java8中流的几个特性,以告诫开发者流并不是高性能的代名词,需谨慎使用流。以下是译文。

流(Stream)是Java8为了实现最佳性能而引入的一个全新的概念。在过去的几年中,随着硬件的持续发展,编程方式已经发生了巨大的改变,程序的性能也随着并行处理、实时、云和其他一些编程方法的出现而得到了不断提高。

Java8中,流性能的提升是通过并行化(parallelism)、惰性(Laziness)和短路操作(short-circuit operations)来实现的。但它也有一个缺点,在选择流的时候需要非常小心,因为这可能会降低应用程序的性能。

下面来看看这三项支撑起流强大性能的因素吧。

并行化

流的并行化充分利用了硬件的相关功能。由于现在计算机上通常都有多个CPU核心,所以在多核系统中如果只使用一个线程则会极大地浪费系统资源。设计和编写多线程应用非常具有挑战性,并且很容易出错,因此,流存在两种实现:顺序和并行。使用并行流非常简单,无需专业知识即可轻松处理多线程问题。

在Java的流中,并行化是通过Fork-Join原理来实现的。根据Fork-Join原理,系统会将较大的任务切分成较小的子任务(称之为forking),然后并行处理这些子任务以充分利用所有可用的硬件资源,最后将结果合并起来(称之为Join)组成完整的结果。

在选择顺序和并行的时候,需要非常谨慎,因为并行并一定意味着性能会更好。

让我们来看一个例子。

StreamTest.java:

package test;
import java.util.ArrayList;
import java.util.List;
public class StreamTest {
 static List < Integer > myList = new ArrayList < > ();
 public static void main(String[] args) {
 for (int i = 0; i < 5000000; i++)
 myList.add(i);
 int result = 0;
 long loopStartTime = System.currentTimeMillis();
 for (int i: myList) {
 if (i % 2 == 0)
 result += i;
 }
 long loopEndTime = System.currentTimeMillis();
 System.out.println(result);
 System.out.println("Loop total Time = " + (loopEndTime - loopStartTime));
 long streamStartTime = System.currentTimeMillis();
 System.out.println(myList.stream().filter(value -> value % 2 == 0).mapToInt(Integer::intValue).sum());
 long streamEndTime = System.currentTimeMillis();
 System.out.println("Stream total Time = " + (streamEndTime - streamStartTime));
 long parallelStreamStartTime = System.currentTimeMillis();
 System.out.println(myList.parallelStream().filter(value -> value % 2 == 0).mapToInt(Integer::intValue).sum());
 long parallelStreamEndTime = System.currentTimeMillis();
 System.out.println("Parallel Stream total Time = " + (parallelStreamEndTime - parallelStreamStartTime));
 }
}

运行结果:

820084320
Loop total Time = 17
820084320
Stream total Time = 81
820084320
Parallel Stream total Time = 30

正如你所见,在这种情况下,for循环更好。因此,在没有正确的分析之前,不要用流代替for循环。在这里,我们可以看到,并行流的性能比普通流更好。

注意:结果可能会因为硬件的不同而不同。

惰性

我们知道,Java8的流有两种类型的操作,分别为中间操作(Intermediate)和最终操作(Terminal)。这两种操作分别用于处理和提供最终结果。如果最终操作不与中间操作相关联,则无法执行。

总之,中间操作只是创建另一个流,不会执行任何处理,直到最终操作被调用。一旦最终操作被调用,则开始遍历所有的流,并且相关的函数会逐一应用到流上。中间操作是惰性操作,所以,流支持惰性。

注意:对于并行流,并不会在最后逐个遍历流,而是并行处理流,并且并行度取决于机器CPU核心的个数。

考虑一下这种情况,假设我们有一个只有中间操作的流片段,而最终操作要稍后才会添加到应用中(可能需要也可能不需要,取决于用户的需求)。在这种情况下,流的中间操作将会为最终操作创建另一个流,但不会执行实际的处理。这种机制有助于提高性能。

我们来看一下有关惰性的例子:

StreamLazinessTest.java:

package test;
import java.util.ArrayList;
import java.util.List;
import java.util.stream.Collectors;
import java.util.stream.Stream;
public class StreamLazinessTest {
 /** Employee class **/
 static class Employee {
 int id;
 String name;
 public Employee(int id, String name) {
 this.id = id;
 this.name = name;
 }
 public String getName() {
 return this.name;
 }
 }
 public static void main(String[] args) throws InterruptedException {
 List < Employee > employees = new ArrayList < > ();
 /** Creating the employee list **/
 for (int i = 1; i < 10000000; i++) {
 employees.add(new StreamLazinessTest.Employee(i, "name_" + i));
 }
 /** Only Intermediate Operations; it will just create another streams and
 * will not perform any operations **/
 Stream < String > employeeNameStreams = employees.parallelStream().filter(employee -> employee.id % 2 == 0)
 .map(employee -> {
 System.out.println("In Map - " + employee.getName());
 return employee.getName();
 });
 /** Adding some delay to make sure nothing has happen till now **/
 Thread.sleep(2000);
 System.out.println("2 sec");
 /** Terminal operation on the stream and it will invoke the Intermediate Operations
 * filter and map **/
 employeeNameStreams.collect(Collectors.toList());
 }
}

运行上面的代码,你可以看到在调用最前操作之前,中间操作不会被执行。

短路行为

这是优化流处理的另一种方法。 一旦条件满足,短路操作将会终止处理过程。 有许多短路操作可供使用。 例如,anyMatch、allMatch、findFirst、findAny、limit等等。

我们来看一个例子。

StreamShortCircuitTest.java:
package test;
import java.util.ArrayList;
import java.util.List;
import java.util.stream.Collectors;
import java.util.stream.Stream;
public class StreamShortCircuitTest {
 /** Employee class **/
 static class Employee {
 int id;
 String name;
 public Employee(int id, String name) {
 this.id = id;
 this.name = name;
 }
 public int getId() {
 return this.id;
 }
 public String getName() {
 return this.name;
 }
 }
 public static void main(String[] args) throws InterruptedException {
 List < Employee > employees = new ArrayList < > ();
 for (int i = 1; i < 10000000; i++) {
 employees.add(new StreamShortCircuitTest.Employee(i, "name_" + i));
 }
 /** Only Intermediate Operations; it will just create another streams and
 * will not perform any operations **/
 Stream < String > employeeNameStreams = employees.stream().filter(e -> e.getId() % 2 == 0)
 .map(employee -> {
 System.out.println("In Map - " + employee.getName());
 return employee.getName();
 });
 long streamStartTime = System.currentTimeMillis();
 /** Terminal operation with short-circuit operation: limit **/
 employeeNameStreams.limit(100).collect(Collectors.toList());
 System.out.println(System.currentTimeMillis() - streamStartTime);
 }
}

运行上面的代码,你会看到性能得到了极大地提升,在我的机器上只需要6毫秒的时间。 在这里,limit()方法在满足条件的时候会中断运行。

最后要注意的是,根据状态的不同有两种类型的中间操作:有状态(Stateful)和无状态(Stateless)中间操作。

有状态中间操作

这些中间操作需要存储状态,因此可能会导致应用程序的性能下降,例如,distinct()、sort()、limit()等等。

无状态中间操作

这些中间操作可以独立处理,因为它们不需要保存状态,例如, filter(),map()等。

在这里,我们了解到,流的出现是为了获得更高的性能,但并不是说使用了流之后性能肯定会得到提升,因此,我们需要谨慎使用。

总结

以上所述是小编给大家介绍的Java8中流的性能及流的几个特性,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我们网站的支持!

(0)

相关推荐

  • Java8中使用流方式查询数据库的方法

    由于关系型数据库操作语言和面向对象语言之间的差异,如今我们仍然需要花费许多时间建立数据库与 Java 应用之间互相沟通的桥梁.通常,我们可以编写自己的映射层(mapping layer),或者使用第三方的 ORM(Object Relational Mapper)对象关系映射框架,比如 Hibernate.ORM 框架虽然使用起来很方便,但是如何正确地配置和提高框架操作数据库的性能却不太容易,ORM 框架往往会使我们的应用性能下降. 最近,我贡献了一个新的开源项目--Speedment,它能使我

  • 详解java8中的Stream数据流

    Stream是java8引入的一个重度使用lambda表达式的API.Stream使用一种类似用SQL语句从数据库查询数据的直观方式来提供一种对Java集合运算和表达的高阶抽象.直观意味着开发者在写代码时只需关注他们想要的结果是什么而无需关注实现结果的具体方式.这一章节中,我们将介绍为什么我们需要一种新的数据处理API.Collection和Stream的不同之处以及如何将StreamAPI应用到我们的编码中. 筛选重复的元素 Stream 接口支持 distinct 的方法, 它会返回一个元素

  • Java8新特性Stream流实例详解

    什么是Stream流? Stream流是数据渠道,用于操作数据源(集合.数组等)所生成的元素序列. Stream的优点:声明性,可复合,可并行.这三个特性使得stream操作更简洁,更灵活,更高效. Stream的操作有两个特点:可以多个操作链接起来运行,内部迭代. Stream可分为并行流与串行流,Stream API 可以声明性地通过 parallel() 与sequential() 在并行流与顺序流之间进行切换.串行流就不必再细说了,并行流主要是为了为了适应目前多核机器的时代,提高系统CP

  • Java8中流的性能及流的几个特性

    摘要:本文介绍了Java8中流的几个特性,以告诫开发者流并不是高性能的代名词,需谨慎使用流.以下是译文. 流(Stream)是Java8为了实现最佳性能而引入的一个全新的概念.在过去的几年中,随着硬件的持续发展,编程方式已经发生了巨大的改变,程序的性能也随着并行处理.实时.云和其他一些编程方法的出现而得到了不断提高. Java8中,流性能的提升是通过并行化(parallelism).惰性(Laziness)和短路操作(short-circuit operations)来实现的.但它也有一个缺点,

  • Java8加java10等于Java18的版本查看及特性详解

    目录 前言 JEP 400 JEP 408 JEP 413 JEP 417 JEP 418 JEP 419 JEP 420 JEP 421 总结 前言 Java 18正式发布, 虽然它不是长期支持 (LTS) 版本,但它却实现了九个 JEP(在Java 18列出).有哪些特性值得关注呢? JEP 400 将 UTF-8 指定为标准 Java API 的默认字符集.通过此更改,依赖于默认字符集的 API 将在所有实现.操作系统.语言环境和配置中保持一致. JEP 408 Java内部终于有原生的W

  • 利用Java8 Optional类优雅如何地解决空指针问题

    前言 Java8 由Oracle在2014年发布,是继Java5之后最具革命性的版本. Java8吸收其他语言的精髓带来了函数式编程,lambda表达式,Stream流等一系列新特性,学会了这些新特性,可以让你实现高效编码优雅编码. 1. 不受待见的空指针异常 有个小故事:null引用最早是由英国科学家Tony Hoare提出的,多年后Hoare为自己的这个想法感到后悔莫及,并认为这是"价值百万的重大失误".可见空指针是多么不受待见. NullPointerException是Java

  • Java 8 Stream流强大的原理

    目录 1.Stream的组成与特点 2.BaseStream接口 3.Stream接口 4.关闭流操作 5.并行流和串行流 6.ParallelStream背后的男人:ForkJoinPool 7.用ForkJoinPool的眼光来看ParallelStream 8.并行流的性能 9.NQ模型 10.遇到顺序 前言: Stream 使用一种类似用 SQL 语句从数据库查询数据的直观方式来提供一种对 Java 集合运算和表达的高阶抽象. Stream API可以极大提高Java程序员的生产力,让程

  • 都9102年了,你还用for循环操作集合吗

    前言 前段时间公司书架多了一本<Java8 实战>,毕竟久闻lambda的大名,于是借来一阅.这一看,简直是惊为天人啊,lambda,stream,java8里简直是满脑子骚操作,看我的一愣一愣的.我甚至是第一次感觉到了什么叫优雅. 本文主要介绍java8中的流处理,看看java8是怎么愉快的玩耍集合的,让我们来一起感受java8的魅力吧! 我就随便举个例子,看看Stream有多优雅. // 对苹果按颜色汇总并绩数量 Map<String, Long> appleCount = a

  • 看完这篇文章获得一些java if优化技巧

    目录 1.if 合并 2.将正常的流程放在函数的主干执行 3.减少if 1. 使用三元运算符表达式 2.使用java8 中流过滤filter ,不使用if 3.使用枚举 4.使用manager 5.使用Consumer 总结: 1.if 合并 使用逻辑运算符进行合并if.简单的if 嵌套可以使用&& 进行合并.简单的if else 并且操作相同可以使用 || 进行合并,优化代码逻辑,增加可读性. 注意:逻辑运算符的截断性,if(a >= 10 || b >= 20) 当a>

  • 详解Java中Collector接口的组成

    一.Collector常常出现的地方 java8引入了stream,Collector是与stream一起出现的,配合stream使用的好帮手,如果用过stream,我们应该都有写过这样的代码 例子1: lists.stream()....collect(Collectors.toList()); 例子2: lists.stream().collect(groupingBy(String::length)); 这两个例子中,toList()和groupingBy()返回的都是一个Collecto

  • Windows 2003 工作手册(3)

    二十一.如何对传入的连接禁用 NetBT 代理    版权所概要 默认情况下,在基于 Windows XP 和 Windows Server 2003 的系统上,对传入的远程访问服务 (RAS) 或虚拟专用网 (VPN) 连接启用 Netbios 代理.此设置允许 RAS 客户端在其所连接的局域网 (LAN) 中解析 Netbios 名称.在被配置为 RAS 或 VPN 服务器的计算机上,如果从命令外壳程序中运行 Ipconfig /all 命令,将返回信息显示WINS Proxy Enable

  • ADO.NET 的最佳实践技巧

    这是我很早以前看过的微软的一篇文章,最近,一些网友问的问题很多理论都在里面,所以,整理一下放在这里,大家可以参考一下. 简介 本文为您提供了在 Microsoft ADO.NET 应用程序中实现和获得最佳性能.可伸缩性以及功能的最佳解决方案:同时也讲述了使用 ADO.NET 中可用对象的最佳实践:并提出一些有助于优化 ADO.NET 应用程序设计的建议. 本文包含: • 有关 .NET 框架包含的 .NET 框架数据提供程序的信息. • DataSet 和 DataReader 之间的比较,以及

  • NetCore 3.0文件上传和大文件上传的限制详解

    NetCore文件上传两种方式 NetCore官方给出的两种文件上传方式分别为"缓冲"."流式".我简单的说说两种的区别, 1.缓冲:通过模型绑定先把整个文件保存到内存,然后我们通过IFormFile得到stream,优点是效率高,缺点对内存要求大.文件不宜过大. 2.流式处理:直接读取请求体装载后的Section 对应的stream 直接操作strem即可.无需把整个请求体读入内存, 以下为官方微软说法 缓冲 整个文件读入 IFormFile,它是文件的 C# 表

随机推荐