JDK9的新特性之String压缩和字符编码的实现方法

简介

String的底层存储是什么?相信大部分人都会说是数组。如果要是再问一句,那么是以什么数组来存储呢?相信不同的人有不同的答案。

在JDK9之前,String的底层存储结构是char[],一个char需要占用两个字节的存储单位。

据说是JDK的开发人员经过调研了成千上万的应用程序的heap dump信息,然后得出了一个结论:大部分的String都是以Latin-1字符编码来表示的,只需要一个字节存储就够了,两个字节完全是浪费。

据说他们用了大数据+人工智能,得出的结论由不得我们不信。

于是在JDK9之后,字符串的底层存储变成了byte[]。

底层实现

先看下java9之前的String是怎么实现的:

public final class String
 implements java.io.Serializable, Comparable<String>, CharSequence {

 //The value is used for character storage.
 private final char value[];
}

再看下java9中String的实现和一些关键的变量:

public final class String
 implements java.io.Serializable, Comparable<String>, CharSequence {

 /** The value is used for character storage. */
 @Stable
 private final byte[] value;

 private final byte coder;

 @Native static final byte LATIN1 = 0;
 @Native static final byte UTF16 = 1;

 static final boolean COMPACT_STRINGS;

 static {
  COMPACT_STRINGS = true;
 }

从代码我们可以看到底层的存储已经变成了byte[]。

再看一下coder变量,coder代表编码的格式,目前String支持两种编码格式LATIN1和UTF16。

LATIN1需要用一个字节来存储。而UTF16需要使用2个字节或者4个字节来存储。

而COMPACT_STRINGS则是用来控制是否开启String的compact功能。默认情况下COMPACT_STRINGS功能是开启的。

如果我们想关闭COMPACT_STRINGS功能则可以使用-XX:-CompactStrings参数。

ps:下面看下jdk8日期格式化的实例代码

package time;
import java.time.*;
import java.time.format.DateTimeFormatter;
import java.time.temporal.ChronoUnit;
import java.util.Calendar;
import java.util.Date;
/***
 * 总结: java.util.Date和 SimpleDateFormat 都是非线程安全的
 * 1. LocalDate
 * 2. LocalTime
 * 3. LocalDateTime
 * 4. DateTimeFormatter
 * 5. ChronoUnit
 */
public class Java8Date {
  public static void main(String[] args) {
    /** #0. Calendar
     * 区别于calendar的month: canlendar中:[]
     * 1. LocalDate的年月日直接是日期中的值;
     * 2. date.getMonthValue() 和 c.get(Calendar.MONTH) 有区别: c:0表示1月
     */
    Calendar c = Calendar.getInstance(); // 测试日期:2019-04-02
    System.out.println(c.get(Calendar.YEAR)); // 2019
    System.out.println(c.get(Calendar.MONTH)); // 3(0=1月)
    System.out.println(c.get(Calendar.DAY_OF_MONTH)); //2
    // #1. LocalDate 2019-04-02 : 今日日期: LocalDate.now()
    System.out.println("=-==-==-==-==-==-==-==-==-==-==");
    LocalDate date = LocalDate.now();
    System.out.println(date); // 2019-04-02
    // #2. year month day: 年月日获取
    System.out.println("=-==-==-==-==-==-==-==-==-==-==");
    int year = date.getYear(); // 2019
    int month = date.getMonthValue();// 4
    int day = date.getDayOfMonth(); // 2
    System.out.println(year + "-" + month + "-" + day); // 2019-4-2
    // #3. 构造日期: 给定年月日
    System.out.println("=-==-==-==-==-==-==-==-==-==-==");
    LocalDate dt1 = LocalDate.of(2019, 3, 8);
    LocalDate dt2 = LocalDate.of(2019, 3, 8);
    // #4. 日期比较: equals
    // true: 内部是比较的 year-year month-month day-day
    System.out.println(dt2.equals(dt1));
    // #5. 周期性日期, 比如: 判断用户的生日
    System.out.println("=-==-==-==-==-==-==-==-==-==-==");
    // 生日:0308
    MonthDay uBirth = MonthDay.of(3, 8);
    MonthDay dtMD = MonthDay.from(dt1);
    // dt1 是不是 用户u的生日:true
    System.out.println("dt1==用户u的生日:" + dtMD.equals(uBirth));
    // #6. 获取当前时间 [HH:mm:ss.SSS]
    System.out.println("=-==-==-==-==-==-==-==-==-==-==");
    LocalTime time = LocalTime.now();
    System.out.println(time);
    // #7. 增减时间 plus/minus
    System.out.println("=-==-==-==-==-==-==-==-==-==-==");
    // dt1=2019-03-08
    LocalDate dt1Plus2d = dt1.plusDays(2);
    LocalDate dt1Plus2y = dt1.plusYears(2);
    LocalDate dt1Plus2m = dt1.plusMonths(2);
    System.out.println(dt1Plus2d); // 2019-03-10
    System.out.println(dt1Plus2y); // 2021-03-08
    System.out.println(dt1Plus2m); // 2019-05-08
    // dt1=2019-03-08
    LocalDate plus1w = dt1.plus(1, ChronoUnit.WEEKS);
    LocalDate plus1d = dt1.plus(1, ChronoUnit.DAYS);
    LocalDate plus18y = dt1.plus(18, ChronoUnit.YEARS);
    LocalDate minus1y = dt1.minus(1, ChronoUnit.YEARS);
    System.out.println(plus1w); // 2019-03-15
    System.out.println(plus1d); // 2019-03-09
    System.out.println(plus18y); // 2037-03-08
    System.out.println(minus1y); // 2018-03-08
    // #8. 日期dt1 早于/晚于 minus1y
    System.out.println("=-==-==-==-==-==-==-==-==-==-==");
    // dt1=2019-03-08 minus1y=2018-03-08
    System.out.println(dt1.isAfter(minus1y)); // true
    System.out.println(dt1.isBefore(minus1y)); // false
    // #9. 计算日期差
    System.out.println("=-==-==-==-==-==-==-==-==-==-==");
    // dt1=2019-03-08 dt20190402
    LocalDate dt20190402 = LocalDate.of(2019, 4, 2);
    Period btPeriod = Period.between(dt1, dt20190402);
    Period btPeriod2 = Period.between(dt1, dt20190402);
    System.out.println(btPeriod); // P25D
    System.out.println(btPeriod.getMonths()); // 0
    System.out.println(btPeriod.getDays()); // 25
    // 25 可见是标量, 不是矢量, 只计算差数
    System.out.println(btPeriod2.getDays());
    // #10. 时间戳Instant->java.util.Date[getTime()==toEpochMilli()]
    System.out.println("=-==-==-==-==-==-==-==-==-==-==");
    Instant now = Instant.now(); // 2019-04-02T08:48:46.755Z
    Date dtNow = Date.from(now); // Tue Apr 02 16:48:46 CST 2019
    long millisInstant = now.toEpochMilli();
    long millisDate = dtNow.getTime();
    System.out.println(millisInstant); // 1554195038598
    System.out.println(millisDate); // 1554195038598
    // #11# ** 日期格式化
    System.out.println("=-==-==-==-==-==-==-==-==-==-==");
    DateTimeFormatter pattern1 = DateTimeFormatter.ofPattern("yyyyMMdd-HH:mm:ss,SSS");
    DateTimeFormatter pattern2 = DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss");
    /**
     * 命题:--> 将 "20190215-22:10:30,333" 日期
     * 格式化为 "yyyyMMdd-HH mm:ss.SSS" 字符串
     * @.1. 字符串转对象LocalDateTime
     * @.2. LocalDateTime对象转字符串
     */
    String strDt = "20190215-22:10:30,333"; // @.1.
    LocalDateTime dateTime = LocalDateTime.parse(strDt, pattern1);
    String fmtDtString = dateTime.format(pattern2); // @.2.
    System.out.println(dateTime); // 2019-02-15T22:10:30.333
    System.out.println(fmtDtString); // 2019-02-15 22:10:30
    System.out.println("=-==-==-==-==-==-==-==-==-==-==");
  }
}

总结

本文讲解了新的String实现和COMPACT_STRINGS模式的关闭方法。

到此这篇关于JDK9的新特性之String压缩和字符编码的实现方法的文章就介绍到这了,更多相关JDK9 新特性内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • JDK10新特性之本地变量类型var的深入理解

    简介 java以面向对象的特性显著于世并得到了蓬勃的发展.在语言的发展过程中,为了让java语言更加简洁和方便使用,JDK也在不断的进行改进. 今天本文将要介绍一下JDK10中引入的本地变量类型var. 为什么我们需要var 类型推断是很多编程语言都具有的特性,编译器可以在我们不指定具体变量类型的情况下推断出该变量的实际类型. 类型推断的出现,可以让程序员的代码更加灵活,利于维护和编写.其实我们一直都有使用到类型推断. JDK8中引入的lambda表达式就是类型推断的一个非常有用的例子: int

  • 浅析JDK12的五大重要新特性(推荐)

    JDK12的五大重要新特性 Java12在March 19, 2019发布了. 在2017年发布Java 9之后,Java平台发布节奏已从每3年以上的主要版本转变为每6个月发布一次功能.现在,每年的3月和9月都会发布新的版本功能. 从而提供了更细化,更快和可管理的版本更新. 这是一个好消息,不好的就是大家会觉得JDK的版本更新太快了. 什么?JDK12已经出来了? 什么?9月份要出JDK13了? 什么?我还在用JDK8? 废话少说,我们来看下JDK12的五个比较重要的新特性: 引入JVM常量AP

  • JDK10新特性之var泛型和多个接口实现方法

    简介 在JDK10的新特性:本地变量类型var中我们讲到了为什么使用var和怎么使用var. 今天我们来深入的考虑一下var和泛型,多个接口实现的问题. 实现多个接口 在JDK的实现和我们日常的工作中,很多时候都需要实现多个接口,我们举常用的两个例子ArrayList和CopyOnWriteArrayList.先看下他们的定义: public class ArrayList<E> extends AbstractList<E> implements List<E>, R

  • JDK9的新特性之String压缩和字符编码的实现方法

    简介 String的底层存储是什么?相信大部分人都会说是数组.如果要是再问一句,那么是以什么数组来存储呢?相信不同的人有不同的答案. 在JDK9之前,String的底层存储结构是char[],一个char需要占用两个字节的存储单位. 据说是JDK的开发人员经过调研了成千上万的应用程序的heap dump信息,然后得出了一个结论:大部分的String都是以Latin-1字符编码来表示的,只需要一个字节存储就够了,两个字节完全是浪费. 据说他们用了大数据+人工智能,得出的结论由不得我们不信. 于是在

  • 详解Java8新特性之interface中的static方法和default方法

    为什么要单独写个Java8新特性,一个原因是我目前所在的公司用的是jdk8,并且框架中用了大量的Java8的新特性,如上篇文章写到的stream方法进行过滤map集合.stream方法就是接口Collection中的default方法.所以准备专门写写关于java8新特性的文章,虽然现在10已经发布了.但还是要认真的去了解下新版本的变化. static方法 java8中为接口新增了一项功能:定义一个或者更多个静态方法.用法和普通的static方法一样. 代码示例 public interface

  • C# 7.0 新特性1之基于Tuple的“多”返回值方法

    原文链接:http://www.cnblogs.com/ylvict/p/5573094.html 回顾  首先,提出一个问题,C#中,如何使一个方法可返回"多个"返回值?  我们先来回顾一下C#6.0 及更早版本的做法.   在C#中,通常我们有以下4种方式使一个方法返回多条数据. •使用 KeyValue 组合 • static void Main(string[] args) { int int1 = 15; int int2 = 25; var result = Add_Mul

  • ES11新增的这9个新特性,你都掌握了吗

    ECMAScript 2020 是 ECMAScript 语言规范的第11版.自1997年出版第一版以来,ECMAScript 已发展成为世界上使用最广泛的通用编程语言之一. ES2020(ES11) 引入了以下新特性: String 的 matchAll 方法 动态导入语句 import() import.meta export * as ns from 'module' Promise.allSettled 一种新的数据类型:BigInt GlobalThis Nullish coalesc

  • 详解Servlet3.0新特性(从注解配置到websocket编程)

    Servlet3.0的出现是servlet史上最大的变革,其中的许多新特性大大的简化了web应用的开发,为广大劳苦的程序员减轻了压力,提高了web开发的效率.主要新特性有以下几个: 引入注解配置 支持web模块化开发 程序异步处理 改进文件上传API 非阻塞式IO读取流 Websocket实时通信 一.注解配置 Servlet3.0新规范顺应了时代的潮流,使用注解配置,取代混乱的web.xml全局配置.在这之前我们在创建servlet,filter,listener时,都是在web.xml中配置

  • 20多个小事例带你重温ES10新特性(小结)

    ES10 虽然没有像 ES6 那么多新特性,但 ES10 仍然有一些有用的特性.文本通过简单示例来介绍了 ES10 新出来的特性.通过这种方式,咱们就可以快速理解,而不需要看太多的官方解释. ES10 新特性主要如下: 数组方法:flat和flatMap Object.fromEntries 字符串方法:trimStart 和 trimEnd Symbol 的 description 属性 try { } catch {} // catch 的参数可以省略了 JSON ⊂ ECMAScript

  • C#6.0中你可能不知道的新特性总结

    为什么写? 今天去上班的公交上,有朋友在张队(张善友)的微信群里,发了一个介绍C# 6.0新特性的视频,视频7分钟,加上本人英语实在太low,整体看下来是一脸懵逼的. 下班回到家里,打开这个视频,把视频中介绍的新特性用文档的形式记录下来,加深自己的印象,此处把我整理的文档分享出来,希望对大家能有所帮助! C#6.0已经发布快三年了,可能我们没有有太去关心新版本所加入的特性,有人说,发布新版本,无非就是添加一些"语法糖"罢了,不管是糖不是糖,既然加入了新功能,那么自然有新功能的好处,我们

  • JDK13的新特性之AppCDS详解

    简介 AppCDS的全称是Application Class-Data Sharing.主要是用来在不同的JVM中共享Class-Data信息,从而提升应用程序的启动速度. 通常来说,如果要执行class字节码,JVM需要执行下面的一些步骤:给定一个类的名字,JVM需要从磁盘上面找到这个文件,加载,并验证字节码,最后将它加载进来. 如果JVM启动的时候需要加载成百上千个class,那么需要的就不是一个小数目了. 对于打包好的jar包来说,只要jar的内容不变,那么jar包中的类的数据始终是相同的

  • Java10新特性解读

    Java10是Java版本23年历史上最快的版本.Java因其缓慢的增长和进化而受到批评,但Java10打破了这一概念.Java10是一个具有许多未来变化的版本,其范围和影响可能并不明显,但却很牵强. 在本文中,我们将讨论Java10发行版中添加的各种特性.在此之前,让我们回顾一下java发布模型中引入的一些更改. 长期支持模式 从2017年开始,Oracle&Java社区宣布将向为期6个月的Java新节奏转变.它转向了oracle javase产品的长期支持(LTS)模型. LTS版本的产品将

随机推荐