JVM系列之String.intern的性能解析

String对象有个特殊的StringTable字符串常量池,为了减少Heap中生成的字符串的数量,推荐尽量直接使用String Table中的字符串常量池中的元素。

那么String.intern的性能怎么样呢?我们一起来看一下。

String.intern和G1字符串去重的区别

之前我们提到了,String.intern方法会返回字符串常量池中的字符串对象的引用。

而G1垃圾回收器的字符串去重的功能其实和String.intern有点不一样,G1是让两个字符串的底层指向同一个byte[]数组。

有图为证:

上图中的String1和String2指向的是同一个byte[]数组。

String.intern的性能

我们看下intern方法的定义:

public native String intern();

大家可以看到这是一个native的方法。native底层肯定是C++实现的。

那么是不是native方法一定会比java方法快呢?

其实native方法有这样几个耗时点:

  1. native方法需要调用JDK-JVM接口,实际上是会浪费时间的。
  2. 性能会受到native方法中HashTable实现方法的制约,如果在高并发的情况下,native的HashTable的实现可能成为性能的制约因素。

举个例子

还是用JMH工具来进行性能分析,我们使用String.intern,HashMap,和ConcurrentHashMap来对比分析,分别调用1次,100次,10000次和1000000。

代码如下:

@State(Scope.Benchmark)
@BenchmarkMode(Mode.AverageTime)
@OutputTimeUnit(TimeUnit.NANOSECONDS)
@Fork(value = 1, jvmArgsPrepend = "-XX:+PrintStringTableStatistics")
@Warmup(iterations = 5)
@Measurement(iterations = 5)
public class StringInternBenchMark {

  @Param({"1", "100", "10000", "1000000"})
  private int size;

  private StringInterner str;
  private ConcurrentHashMapInterner chm;
  private HashMapInterner hm;

  @Setup
  public void setup() {
    str = new StringInterner();
    chm = new ConcurrentHashMapInterner();
    hm = new HashMapInterner();
  }

  public static class StringInterner {
    public String intern(String s) {
      return s.intern();
    }
  }

  @Benchmark
  public void useIntern(Blackhole bh) {
    for (int c = 0; c < size; c++) {
      bh.consume(str.intern("doit" + c));
    }
  }

  public static class ConcurrentHashMapInterner {
    private final Map<String, String> map;

    public ConcurrentHashMapInterner() {
      map = new ConcurrentHashMap<>();
    }

    public String intern(String s) {
      String exist = map.putIfAbsent(s, s);
      return (exist == null) ? s : exist;
    }
  }

  @Benchmark
  public void useCurrentHashMap(Blackhole bh) {
    for (int c = 0; c < size; c++) {
      bh.consume(chm.intern("doit" + c));
    }
  }

  public static class HashMapInterner {
    private final Map<String, String> map;

    public HashMapInterner() {
      map = new HashMap<>();
    }

    public String intern(String s) {
      String exist = map.putIfAbsent(s, s);
      return (exist == null) ? s : exist;
    }
  }

  @Benchmark
  public void useHashMap(Blackhole bh) {
    for (int c = 0; c < size; c++) {
      bh.consume(hm.intern("doit" + c));
    }
  }

  public static void main(String[] args) throws RunnerException {
    Options opt = new OptionsBuilder()
        .include(StringInternBenchMark.class.getSimpleName())
        .build();
    new Runner(opt).run();
  }
}

输出结果:

Benchmark                                 (size)  Mode  Cnt          Score          Error  Units
StringInternBenchMark.useCurrentHashMap        1  avgt    5         34.259 ±        7.191  ns/op
StringInternBenchMark.useCurrentHashMap      100  avgt    5       3623.834 ±      499.806  ns/op
StringInternBenchMark.useCurrentHashMap    10000  avgt    5     421010.654 ±    53760.218  ns/op
StringInternBenchMark.useCurrentHashMap  1000000  avgt    5   88403817.753 ± 12719402.380  ns/op
StringInternBenchMark.useHashMap               1  avgt    5         36.927 ±        6.751  ns/op
StringInternBenchMark.useHashMap             100  avgt    5       3329.498 ±      595.923  ns/op
StringInternBenchMark.useHashMap           10000  avgt    5     417959.200 ±    62853.828  ns/op
StringInternBenchMark.useHashMap         1000000  avgt    5   79347127.709 ±  9378196.176  ns/op
StringInternBenchMark.useIntern                1  avgt    5        161.598 ±        9.128  ns/op
StringInternBenchMark.useIntern              100  avgt    5      17211.037 ±      188.929  ns/op
StringInternBenchMark.useIntern            10000  avgt    5    1934203.794 ±   272954.183  ns/op
StringInternBenchMark.useIntern          1000000  avgt    5  418729928.200 ± 86876278.365  ns/op

从结果我们可以看到,intern要比其他的两个要慢。

所以native方法不一定快。intern的用处不是在于速度,而是在于节约Heap中的内存使用。

到此这篇关于JVM系列之String.intern的性能解析的文章就介绍到这了,更多相关String.intern的性能内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • 关于java String中intern的深入讲解

    序 本文主要研究一下java String的intern String.intern() java.base/java/lang/String.java public final class String implements java.io.Serializable, Comparable<String>, CharSequence, Constable, ConstantDesc { //...... /** * Returns a canonical representation for

  • 通过String.intern()方法浅谈堆中常量池

    简介 String是我们最常用的一个类,和普通java类一样其对象会存在java堆中.但是String类有其特殊之处,可以通过new方法生成,也可以通过带引号的字符串常量直接赋值.在JDK7之前,字符串常量是存在永久带Perm 区的,JDK7开始在将常量池迁移到堆中,这个变化也导致了String的新特性,下面我们慢慢进行介绍. String.intern()方法 简单的说,String.intern()方法的作用就是返回常量池中字符串对象,在对该方法进行详解之前,我们看几个创建字符串对象的例子.

  • C#中字符串优化String.Intern、IsInterned详解

    前言 string是一种很特殊的数据类型,它既是基元类型又是引用类型,在编译以及运行时,.Net都对它做了一些优化工作,正式这些优化工作有时会迷惑编程人员,使string看起来难以琢磨.本文将给大家详细介绍关于C#字符串优化String.Intern.IsInterned的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧. 首先看一段程序: using System; class Program { static void Main(string[] args) { st

  • java String的intern方法

    首先我们应该清楚的是JDK1.6和JDK1.7中String类的intern方法还是有差别的: JDK1.6中的intern:   调用intern方法的时候首先会去常量池中查看是否存在与当前String值相同的值,如果存在的话,则直接返回常量池中这个String值的引用:如果不存在的话,则会将原先堆中的该字符串拷贝一份到常量池中. JDK1.7中的intern:   调用intern方法的时候首先会去常量池中查看是否存在与当前String值相同的值,如果存在的话,则直接返回常量池中这个Stri

  • JVM系列之String.intern的性能解析

    String对象有个特殊的StringTable字符串常量池,为了减少Heap中生成的字符串的数量,推荐尽量直接使用String Table中的字符串常量池中的元素. 那么String.intern的性能怎么样呢?我们一起来看一下. String.intern和G1字符串去重的区别 之前我们提到了,String.intern方法会返回字符串常量池中的字符串对象的引用. 而G1垃圾回收器的字符串去重的功能其实和String.intern有点不一样,G1是让两个字符串的底层指向同一个byte[]数组

  • Java中的String对象数据类型全面解析

    1. 首先String不属于8种基本数据类型,String是一个对象. 因为对象的默认值是null,所以String的默认值也是null;但它又是一种特殊的对象,有其它对象没有的一些特性. 2. new String()和new String("")都是申明一个新的空字符串,是空串不是null; 3. String str="kvill"; String str=new String ("kvill");的区别: 在这里,我们不谈堆,也不谈栈,只

  • Java String 字符串常量池解析

    作为最基础的引用数据类型,Java 设计者为 String 提供了字符串常量池以提高其性能,那么字符串常量池的具体原理是什么,我们带着以下三个问题,去理解字符串常量池: 字符串常量池的设计意图是什么? 字符串常量池在哪里? 如何操作字符串常量池? 字符串常量池的设计思想 字符串的分配,和其他的对象分配一样,耗费高昂的时间与空间代价,作为最基础的数据类型,大量频繁的创建字符串,极大程度地影响程序的性能 JVM为了提高性能和减少内存开销,在实例化字符串常量的时候进行了一些优化 为字符串开辟一个字符串

  • JVM系列之:再谈java中的safepoint说明

    safepoint是什么 java程序里面有很多很多的java线程,每个java线程又有自己的stack,并且共享了heap.这些线程一直运行呀运行,不断对stack和heap进行操作. 这个时候如果JVM需要对stack和heap做一些操作该怎么办呢? 比如JVM要进行GC操作,或者要做heap dump等等,这时候如果线程都在对stack或者heap进行修改,那么将不是一个稳定的状态.GC直接在这种情况下操作stack或者heap,会导致线程的异常. 怎么处理呢? 这个时候safepoint

  • JVM系列之:JIT中的Virtual Call接口操作

    简介 上一篇文章我们讲解了Virtual Call的定义并举例分析了Virtual Call在父类和子类中的优化. JIT对类可以进行优化,那么对于interface可不可以做同样的优化么? 一起来看看吧. 最常用的接口List List应该是大家最最常用的接口了,我想这个大家应该不会反驳. public interface List<E> extends Collection<E> { 今天我们就拿List来做例子,体验一下JIT优化接口的奥秘. 还是上代码,要分析的代码如下:

  • 浅谈JVM系列之JIT中的Virtual Call

    Virtual Call和它的本质 有用过PrintAssembly的朋友,可能会在反编译的汇编代码中发现有些方法调用的说明是invokevirtual,实际上这个invokevirtual就是Virtual Call. Virtual Call是什么呢? 面向对象的编程语言基本上都支持方法的重写,我们考虑下面的情况: private static class CustObj { public void methodCall() { if(System.currentTimeMillis()==

  • 详解JVM系列之内存模型

    1. 内存模型和运行时数据区 这一章学习java虚拟机内存模型(Java Virtual machine menory model),可以这样理解,jvm运行时数据库是一种规范,而JVM内存模型是对改规范的实现 java虚拟机重点存储数据的是堆和方法区,所以本章节也重点从这两个方面进行比较详细描述.堆和方法区是内存共享的,而java虚拟机栈.Native方法栈.程序计数器是线程私有的 2.思维导图和图例 一个是非堆区(方法区),方法区也一般被称之为"永久代".另外一个是堆区,分为you

  • java中String.intern()方法功能介绍

    下文笔者讲述java中String.intern()方法的功能简介说明,如下所示: String.intern原理 String.intern():    此方法是一个Native方法      底层调用C++的 StringTable::intern方法实现 当通过语句str.intern()调用intern()方法后    JVM 就会在当前类的常量池中查找是否存在与str等值的String     若存在则直接返回常量池中相应Strnig的引用     若不存在,则会在常量池中创建一个等值

  • 浅谈JVM系列之从汇编角度分析NullCheck

    一个普通的virtual call 我们来分析一下在方法中调用list.add方法的例子: public class TestNull { public static void main(String[] args) throws InterruptedException { List<String> list= new ArrayList(); list.add("www.flydean.com"); for (int i = 0; i < 10000; i++)

随机推荐