JDK9对String字符串的新一轮优化

2025-01-31 18:21:44

String类可以说是Java编程中使用最多的类了，如果能对String字符串的性能进行优化，那么程序的性能必然能大幅提升。

这不JDK9就对String字符串进行了改进升级，在某些场景下可以让String字符串内存减少一半，进而减少JVM的GC次数。

String的底层存储

在面试的时候我们通常会说String字符串有不可变的特性，每次都要创建新的字符串。那么，为什么String字符串是不可变的呢？

先来看一下String字符串的底层存储结构：

public final class String
  implements java.io.Serializable, Comparable<String>, CharSequence {

  private final char value[];

  public String() {
    this.value = "".value;
  }

  public String(String original) {
    this.value = original.value;
    this.hash = original.hash;
  }
  // ...
}

看到什么了？当我们new一个String对象时，对应的字符串其实是以char数组的形式存储在String对象内部。而这个char数组是final的，也就是说不可变的。

这也就是为什么我们说String字符串拥有不可变的特性，当字符串改变了，char数组不可变，就只能创建一个新的对象，新的char数组了。

底层存储的优化

上面说的情况是JDK8及以前版本，到了JDK9，String中字符串的存储不再用char数组了，改用byte数组。

public final class String
  implements java.io.Serializable, Comparable<String>, CharSequence {

  @Stable
  private final byte[] value;

  private final byte coder;

  @Native static final byte LATIN1 = 0;
  @Native static final byte UTF16 = 1;

  static final boolean COMPACT_STRINGS;

  public String() {
    this.value = "".value;
    this.coder = "".coder;
  }

  @HotSpotIntrinsicCandidate
  public String(String original) {
    this.value = original.value;
    this.coder = original.coder;
    this.hash = original.hash;
  }

  // ...
}

不仅将char数组改为byte数组，而且新增了一个coder的成员变量。

在程序中，绝大多数字符串只包含英文字母数字等字符，使用Latin-1编码，一个字符占用一个byte。如果使用char，一个char要占用两个byte，会占用双倍的内存空间。

但是，如果字符串中使用了中文等超出Latin-1表示范围的字符，使用Latin-1就没办法表示了。这时JDK会使用UTF-16编码，那么占用的空间和旧版（使用char[]）是一样的。

coder变量代表编码的格式，目前String支持两种编码格式Latin-1和UTF-16。Latin-1需要用一个字节来存储，而UTF-16需要使用2个字节或者4个字节来存储。

据说这一改进方案是JDK的开发人员用大数据和人工能智能，调研了成千上万的应用程序的heapdump信息后，得出：大部分的String都是以Latin-1字符编码来表示的，只需要一个字节存储就够了，两个字节完全是浪费。

COMPACT_STRINGS属性则是用来控制是否开启String的compact功能。默认情况下是开启的。可以使用-XX:-CompactStrings参数来对此功能进行关闭。

改进的好处

改进的好处是非常明显的，首先如果项目中使用Latin-1字符集居多，内存的占用大幅度减少，同样的硬件配置可以支撑更多的业务。

当内存减少之后，进一步导致减少GC次数，进而减少Stop-The-World的频次，同样会提升系统的性能。

小结

随着JDK的迭代String字符串的内存结构及方法等也在不断地进行演变。这是因为String字符串往往是JVM中占用内存最多的类，通过对它的改造升级，对性能的提升会更加明显。

到此这篇关于JDK9对String字符串的新一轮优化的文章就介绍到这了,更多相关JDK9对String字符串优化内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

JDK9的新特性之String压缩和字符编码的实现方法

简介 String的底层存储是什么?相信大部分人都会说是数组.如果要是再问一句,那么是以什么数组来存储呢?相信不同的人有不同的答案. 在JDK9之前,String的底层存储结构是char[],一个char需要占用两个字节的存储单位. 据说是JDK的开发人员经过调研了成千上万的应用程序的heap dump信息,然后得出了一个结论:大部分的String都是以Latin-1字符编码来表示的,只需要一个字节存储就够了,两个字节完全是浪费. 据说他们用了大数据+人工智能,得出的结论由不得我们不信. 于是在
JDK9对String字符串的新一轮优化

String类可以说是Java编程中使用最多的类了,如果能对String字符串的性能进行优化,那么程序的性能必然能大幅提升. 这不JDK9就对String字符串进行了改进升级,在某些场景下可以让String字符串内存减少一半,进而减少JVM的GC次数. String的底层存储在面试的时候我们通常会说String字符串有不可变的特性,每次都要创建新的字符串.那么,为什么String字符串是不可变的呢? 先来看一下String字符串的底层存储结构: public final class Strin
老生常谈Java String字符串(必看篇)

Java中字符串对象创建有两种形式,一种为字面量形式,如String str = "hello";,另一种就是使用new这种标准的构造对象的方法,如String str = new String("hello"); 对于这样的常识,不再赘述. 首先String类是final类,为什么定义成final形式呢? 简单点说,对于如此高频率被使用的数据类型,设计者们认为已经设计的足够优秀了,不需要被继承,否则胡乱继承重写可能会降低程序的性能. 正如标题所述,既然深入,那我们
C# String字符串案例详解

string是一种很特殊的数据类型,它既是基元类型又是引用类型,在编译以及运行时,.Net都对它做了一些优化工作,正式这些优化工作有时会迷惑编程人员,使string看起来难以琢磨.这篇文章共四节,来讲讲关于string的陌生一面. 一．恒定的字符串要想比较全面的了解stirng类型,首先要清楚.Net中的值类型与引用类型. 在C#中,以下数据类型为值类型: bool.byte.char.enum.sbyte以及数字类型(包括可空类型) 以下数据类型为引用类型: class.interface
Golong字符串拼接性能优化及原理介绍

目录 1.字符串高效拼接 1.1 常见的字符串拼接 1.2 字符串拼接测试 1.3 推荐 2.相关原理 2.1 + 号 2.2 strings.Builder 与 bytes.Buffer 2.2.1 内部[]byte 增长方式: 2.2.2 性能比较 1.字符串高效拼接 go 字符串是不可修改的,所谓字符串拼接就是创建新的字符串对象.如果代码中存在大量的字符串拼接,那么性能将会存在影响. 1.1 常见的字符串拼接 +号 func plusConcat(n int, s string) stri
Javascript类型系统之String字符串类型详解

javascript没有表示单个字符的字符型,只有字符串String类型,字符型相当于仅包含一个字符的字符串字符串String是javascript基本数据类型,同时javascript也支持String对象,它是一个原始值的包装对象.在需要时,javascript会自动在原始形式和对象形式之间转换.本文将介绍字符串String原始类型及String包装对象定义字符串String类型是由引号括起来的一组由16位Unicode字符组成的字符序列字符串类型常被用于表示文本数据,此时字符串中的
Java String字符串补0或空格的实现代码

废话不多说了,关键代码如下所示: package cn.com.songjy; import java.text.NumberFormat; //Java 中给数字左边补0 public class NumberFormatTest { public static void main(String[] args) { // 待测试数据 int i = 1; // 得到一个NumberFormat的实例 NumberFormat nf = NumberFormat.getInstance(); /
C++ string 字符串查找匹配实例代码

在写C++程序中,总会遇到要从一个字符串中查找一小段子字符串的情况,对于在C中,我们经常用到strstr()或者strchr()这两种方法.而对于C++的string,我们往往会用到find(). C++:#inlcude<string> C: #include<string.h> find():在一个字符串中查找一个指定的单个字符或字符数组.如果找到,就返回首次匹配的开始位置:如果没有查找到匹配的内容,就返回string::npos. find_first_of():在一个目标串
Java Base64位编码与String字符串的相互转换,Base64与Bitmap的相互转换实例代码

首先是网上大神给的类 package com.duanlian.daimengmusic.utils; public final class Base64Util { private static final int BASELENGTH = 128; private static final int LOOKUPLENGTH = 64; private static final int TWENTYFOURBITGROUP = 24; private static final int EIGH
String字符串截取的四种方式总结

如下所示: import java.util.StringTokenizer; import java.util.regex.Pattern; import org.junit.Test; public class TestStringToken { @Test public void subSting() { String str = "java,javac,javae"; String s1 = str.substring(2);//"va,javac,javae&quo
JavaScript String(字符串)对象的简单实例(推荐)

返回字符串的长度: <html> <body> <script type="text/javascript"> var txt="Hello World!" document.write(txt.length) </script> </body> </html> 为字符串添加样式: <html> <body> <script type="text/java

JDK9对String字符串的新一轮优化

String的底层存储

底层存储的优化

改进的好处

小结

相关推荐

随机推荐