浅谈Java的虚拟机结构以及虚拟机内存的优化

2025-02-19 20:53:53

工作以来，代码越写越多，程序也越来越臃肿，效率越来越低，对于我这样一个追求完美的程序员来说，这是绝对不被允许的，于是除了不断优化程序结构外，内存优化和性能调优就成了我惯用的“伎俩”。

要对Java程序进行内存优化和性能调优，不了解虚拟机的内部原理(或者叫规范更严谨一点)是肯定不行的，这里推荐一本好书《深入Java虚拟机(第二版)》(Bill Venners著，曹晓刚蒋靖译，实际上本文正是作者阅读本书之后，对Java虚拟机的个人理解阐述)。当然了，了解Java虚拟机的好处并不仅限于上述两点好处。从更深一点的技术层面上看，了解Java虚拟机的规范和实现，将更加有助于我们编写高效、稳定的Java代码。比如，假如了解Java虚拟机的内存模型，了解虚拟机的内存回收机制，那么我们就不会过分依赖它，而会在需要的时候显式的”释放内存”(Java代码不能显式释放内存，但是可以通过释放对象引用告知垃圾回收器回收该对象需要被回收)，以降低不必要的内存消耗；假如我们了解Java栈的工作原理，那么我们就可以通过减少递归层数，减少循环次数来降低堆栈溢出的风险。可能对于应用开发人员来说，可能不会直接去涉及这些Java虚拟机底层实现的工作，但是了解这些背景知识，或多或少，都会对我们写的程序产生潜移默化的好的影响。

本篇文章，将简明扼要的说明Java虚拟机的体系结构和内存模型，如有用词不妥或解释不准确之处，请不吝指正，深感荣幸!

Java 虚拟机体系结构

类装载子系统

Java虚拟机有两种类装载器，分别是启动类装载器和用户自定义装载器。

通类装载子系统通过类的全限定名（包名和类名，网络装载还包括 URL）将 Class 装载进运行时数据区。对于每一个被装载的类型，Java虚拟机都会创建一个java.lang.Class类的实例来代表该类型，该实例被放在内存中的堆区，而装载的类型信息则位于方法区，这一点和所有其他对象都是一样的。

类装载子系统在装载一个类型前，除了要定位和导入对应的二进制class文件外，还要验证导入类的正确性，为类变量分配并初始化内存，以及解析符号引用为直接引用，这些动作严格按照以下顺序进行：

1）装载——查找并装载类型的二进制数据；

2）连接——执行验证，准备以及解析(可选)

3）验证确保被导入类型的正确性

4）准备为类变量分配内存，并将其初始化为默认值

5）解析把类型中的符号引用转换为直接应用

方法区

对于每一个被类装载子系统装载的类型，虚拟机都会保存下列数据到方法区：

1.类型的全限定名

2.类型超类的全限定名(java.lang.Object没有超类)

3.类型是类类型还是接口类型

4.类型的访问修饰符

5.任何直接超接口的全限定名有序列表

除了上述基本类型信息，还将保存如下信息：

6.类型的常量池
7.字段信息(包括字段名、字段类型、字段修饰符)
8.方法信息(包括方法名、返回类型、参数的数量和类型、方法修饰符，如果方法不是抽象和本地的，还将保存方法的字节码、操作数栈和该方法栈帧中的局部变量区的大小和异常表)
9.常量以外的所有类变量(其实就是类的静态变量，因为静态变量是所有实例共享的，且与类型直接相关，所以他们是类一级的变量，作为类的成员被保存在方法区)
10.一个到类ClassLoader的引用

//返回的就是刚才保存的ClassLoader引用
String.class.getClassLoader();
一个到Class类的引用

//将返回刚才保存的Class类的引用
String.class;

注意，方法区也是可以被垃圾回收器回收的。

堆

Java程序在运行时创建的所有类实例或数组都放在同一个堆中，而每一个Java虚拟机也是有一个堆空间，所有线程共享一个堆(这就是一个多线程的Java程序会产生对象访问的同步问题的原因了)。

由于每一种Java虚拟机都有对虚拟机规范的不同实现，所以我们可能不知道每一种Java虚拟机在堆中是以何种形式表示对象实例的，不过我们可以通过下面这可能的实现来一窥端倪：

程序计数器

对于运行中的Java程序而言，每一个线程都有自己的PC（程序计数器）寄存器，它是在该线程启动时创建的，大小为一个字长，用来保存需要被执行的下一行代码的位置。

Java栈

每一个线程都有一个Java栈，以栈帧为单位保存线程的运行状态。虚拟机对Java栈的操作有两种：压栈和出栈，二者都已帧为单位。栈帧保存了传入参数、局部变量、中间运算结果等数据，在方法完成时被弹出，然后释放。

看一下两个局部变量相加时栈帧的内存快照

本地方法栈

这是 Java 调用操作系统本地库的地方，用来实现 JNI（Java Native Interface，Java 本地接口）

执行引擎

Java虚拟机的核心，控制装入 Java 字节码并解析；对于运行中的Java程序而言，每一个线程都是一个独立的虚拟机执行引擎的实例，从线程生命周期的开始到结束，他要么在执行字节码，要么在执行本地方法。

本地接口

连接了本地方法栈和操作系统库。

注:文中所有提到”Java虚拟机”的地方都是指”JavaEE和JavaSE平台的Java虚拟机规范”。

虚拟机内存优化实践

既然提到内存，就不得不说到内存泄露。众所周知，Java是从C++的基础上发展而来的，而C++程序的很大的一个问题就是内存泄露难以解决，尽管Java的JVM有一套自己的垃圾回收机制来回收内存，在许多情况下并不需要java程序开发人员操太多的心，但也是存在泄露问题的，只是比C++小一点。比如说，程序中存在被引用但无用的对象：程序引用了该对象，但后续不会或者不能再使用它，那么它占用的内存空间就浪费了。

我们先来看看GC是如何工作的:监控每一个对象的运行状态，包括对象的申请、引用、被引用、赋值等，当该对象不再被引用时，释放对象(GC本文的重点，不做过多阐述)。很多Java程序员过分依赖GC，但问题的关键是无论JVM的垃圾回收机制做得多好，内存总归是有限的资源，因此就算GC会为我们完成了大部分的垃圾回收，但适当地注意编码过程中的内存优化还是很必要的。这样可以有效的减少GC次数，同时提升内存利用率，最大限度地提高程序的效率。

总体而言，Java虚拟机的内存优化应从两方面着手：Java虚拟机和Java应用程序。前者指根据应用程序的设计通过虚拟机参数控制虚拟机逻辑内存分区的大小以使虚拟机的内存与程序对内存的需求相得益彰；后者指优化程序算法，降低GC负担，提高GC回收成功率。

通过参数优化虚拟机内存的参数如下所示：

Xms

初始Heap大小

Xmx

java heap最大值

Xmn

young generation的heap大小

Xss

每个线程的Stack大小

上面是三个比较常用的参数，还有一些：

XX:MinHeapFreeRatio=40

Minimum percentage of heap free after GC to avoid expansion.

XX:MaxHeapFreeRatio=70

Maximum percentage of heap free after GC to avoid shrinking.

XX:NewRatio=2

Ratio of new/old generation sizes. [Sparc -client:8; x86 -server:8; x86 -client:12.]-client:8 (1.3.1+), x86:12]

XX:NewSize=2.125m

Default size of new generation (in bytes) [5.0 and newer: 64 bit VMs are scaled 30% larger; x86:1m; x86, 5.0 and older: 640k]

XX:MaxNewSize=

Maximum size of new generation (in bytes). Since 1.4, MaxNewSize is computed as a function of NewRatio.

XX:SurvivorRatio=25

Ratio of eden/survivor space size [Solaris amd64: 6; Sparc in 1.3.1: 25; other Solaris platforms in 5.0 and earlier: 32]

XX:PermSize=

Initial size of permanent generation

XX:MaxPermSize=64m

Size of the Permanent Generation. [5.0 and newer: 64 bit VMs are scaled 30% larger; 1.4 amd64: 96m; 1.3.1 -client: 32m.]

下面所说通过优化程序算法来提高内存利用率，并降低内存风险，完全是经验之谈，仅供参考，如有不妥，请指正，谢谢！

1.尽早释放无用对象的引用(XX = null;)

看一段代码：

public List<PageData> parse(HtmlPage page) {
  List<PageData> list = null;
  try {
   List valueList = page.getByXPath(config.getContentXpath());
   if (valueList == null || valueList.isEmpty()) {
    return list;
   }
   //需要时才创建对象,节省内存，提高效率
   list = new ArrayList<PageData>();
   PageData pageData = new PageData();
   StringBuilder value = new StringBuilder();
   for (int i = 0; i < valueList.size(); i++) {
    HtmlElement content = (HtmlElement) valueList.get(i);
    DomNodeList<HtmlElement> imgs = content.getElementsByTagName("img");
    if (imgs != null && !imgs.isEmpty()) {
     for (HtmlElement img : imgs) {
      try {
       HtmlImage image = (HtmlImage) img;
       String path = image.getSrcAttribute();
       String format = path.substring(path.lastIndexOf("."), path.length());
       String localPath = "D:/images/" + MD5Helper.md5(path).replace("\\", ",").replace("/", ",") + format;
       File localFile = new File(localPath);
       if (!localFile.exists()) {
        localFile.createNewFile();
        image.saveAs(localFile);
       }
       image.setAttribute("src", "file:///" + localPath);
       localFile = null;
       image = null;
       img = null;
      } catch (Exception e) {
      }
     }
     //这个对象以后不会在使用了，清除对其的引用，等同于提前告知GC，该对象可以回收了
     imgs = null;
    }
    String text = content.asXml();
    value.append(text).append("<br/>");
    valueList=null;
    content = null;
    text = null;
   }
   pageData.setContent(value.toString());
   pageData.setCharset(page.getPageEncoding());
   list.add(pageData);
   //这里 pageData=null; 是没用的，因为list仍然持有该对象的引用，GC不会回收它
   value=null;
   //这里可不能 list=null; 因为list是方法的返回值，否则你从该方法中得到的返回值永远为空，而且这种错误不易被发现、排除
  } catch (Exception e) {
  }
  return list;
}

2.谨慎使用集合数据类型，如数组，树，图，链表等数据结构，这些数据结构对GC来说回收更复杂。

3.避免显式申请数组空间，不得不显式申请时，尽量准确估计其合理值。

4.尽量避免在类的默认构造器中创建、初始化大量的对象，防止在调用其自类的构造器时造成不必要的内存资源浪费

5.尽量避免强制系统做垃圾内存的回收，增长系统做垃圾回收的最终时间

6.尽量做远程方法调用类应用开发时使用瞬间值变量，除非远程调用端需要获取该瞬间值变量的值。

7.尽量在合适的场景下使用对象池技术以提高系统性能

了解Java虚拟机JVM的基本结构及JVM的内存溢出方式

JVM内部结构图 Java虚拟机主要分为五个区域:方法区.堆.Java栈.PC寄存器.本地方法栈.下面来看一些关于JVM结构的重要问题. 1.哪些区域是共享的?哪些是私有的? Java栈.本地方法栈.程序计数器是随用户线程的启动和结束而建立和销毁的, 每个线程都有独立的这些区域.而方法区.堆是被整个JVM进程中的所有线程共享的. 2.方法区保存什么?会被回收吗? 方法区不是只保存的方法信息和代码,同时在一块叫做运行时常量池的子区域还保存了Class文件中常量表中的各种符号引用,以及翻译出来的
Java虚拟机JVM性能优化（三）:垃圾收集详解

Java平台的垃圾收集机制显著提高了开发者的效率,但是一个实现糟糕的垃圾收集器可能过多地消耗应用程序的资源.在Java虚拟机性能优化系列的第三部分,Eva Andreasson向Java初学者介绍了Java平台的内存模型和垃圾收集机制.她解释了为什么碎片化(而不是垃圾收集)是Java应用程序性能的主要问题所在,以及为什么分代垃圾收集和压缩是目前处理Java应用程序碎片化的主要办法(但不是最有新意的). 垃圾收集(GC)的目的是释放那些不再被任何活动对象引用的Java对象所占用的内存,它是Java
Java虚拟机最多支持多少个线程的探讨

McGovernTheory在StackOverflow提了这样一个问题: Java虚拟机最多支持多少个线程?跟虚拟机开发商有关么?跟操作系统呢?还有其他的因素吗? Eddie的回答: 这取决于你使用的CPU,操作系统,其他进程正在做的事情,你使用的Java的版本,还有其他的因素.我曾经见过一台Windows服务器在宕机之前有超过6500个线程.当然,大多数线程什么事情也没有做.一旦一台机器上有差不多6500个线程(Java里面),机器就会开始出问题,并变得不稳定. 以我的经验来看,JVM容纳的
Java虚拟机装载和初始化一个class类代码解析

在 java 应用程序开发中,只有被 java 虚拟机装载的 Class 类型才能在程序中使用.只要生成的字节码符合 java 虚拟机的指令集和文件格式,就可以在 JVM 上运行,这为 java 的跨平台性提供条件.下面,我们来看看虚拟机是如何装载和初始化一个 class 类的. 装载一个类学习过C/C++语言的读者知道,C/C++源代码必须首先别编译成本地的机器代码,然后还需要一个链接代码过程.该链接过程的主要任务就是:合并不同的源码文件产出的中间代码,并最终获得一个可直接执行的应用程序.然
Java虚拟机JVM性能优化（二）:编译器

本文将是JVM 性能优化系列的第二篇文章(第一篇:传送门),Java 编译器将是本文讨论的核心内容. 本文中,作者(Eva Andreasson)首先介绍了不同种类的编译器,并对客户端编译,服务器端编译器和多层编译的运行性能进行了对比.然后,在文章的最后介绍了几种常见的JVM优化方法,如死代码消除,代码嵌入以及循环体优化. Java最引以为豪的特性"平台独立性"正是源于Java编译器.软件开发人员尽其所能写出最好的java应用程序,紧接着后台运行的编译器产生高效的基于目标平台的可执行代
Java虚拟机JVM性能优化（一）:JVM知识总结

Java应用程序是运行在JVM上的,但是你对JVM技术了解吗?这篇文章(这个系列的第一部分)讲述了经典Java虚拟机是怎么样工作的,例如:Java一次编写的利弊,跨平台引擎,垃圾回收基础知识,经典的GC算法和编译优化.之后的文章会讲JVM性能优化,包括最新的JVM设计--支持当今高并发Java应用的性能和扩展. 如果你是一个开发人员,你肯定遇到过这样的特殊感觉,你突然灵光一现,所有的思路连接起来了,你能以一个新的视角来回想起你以前的想法.我个人很喜欢学习新知识带来的这种感觉.我已经有过很多次这样
浅谈Java继承中的转型及其内存分配

看书的时候被一段代码能凌乱啦,代码是这样的: package 继承; abstract class People { public String tag = "疯狂Java讲义"; //① public String name = "Parent"; String getName(){ return name; } } class Student extends People { //定义一个私有的tag实例变量来隐藏父类的tag实例变量 String tag =
浅谈Android系统的基本体系结构与内存管理优化

Android运行环境一览 Android基于linux内核,面向移动终端的操作系统.主要包括以下几个方面: Application Framework: 这一层为应用开发者提供了丰富的应用编程接口,如 Activity Manager,Content Provider,Notification Manager,以及各种窗口 Widget 资源等.所有的APP都是运行在这一层之上. Dalvik 虚拟机: Dalvik VM采用寄存器架构,而不是JVM的栈架构,更适于移动设备.java源代码经过
浅谈Java随机数的原理、伪随机和优化

这篇来说说Java中的随机数,以及为什么说随机数是伪随机. 目录: Math.random() Random类伪随机如何优化随机封装的一个随机处理工具类 1. Math.random() 1.1 介绍通过Math.random()可以获取随机数,它返回的是一个[0.0, 1.0)之间的double值. private static void testMathRandom() { double random = Math.random(); System.out.println("rand
浅谈java object对象在heap中的结构

对象和其隐藏的秘密 java.lang.Object大家应该都很熟悉了,Object是java中一切对象的鼻祖. 接下来我们来对这个java对象的鼻祖进行一个详细的解剖分析,从而理解JVM的深层次的秘密. 工具当然是使用JOL: @Slf4j public class JolUsage { @Test public void useJol(){ log.info("{}", VM.current().details()); log.info("{}", ClassL
浅谈java对象结构对象头 Markword

概述对象实例由对象头.实例数据组成,其中对象头包括markword和类型指针,如果是数组,还包括数组长度; | 类型 | 32位JVM | 64位JVM| | ------ ---- | ------------| --------- | | markword | 32bit | 64bit | | 类型指针 | 32bit |64bit ,开启指针压缩时为32bit | | 数组长度 | 32bit |32bit | header.png compressed_header.png 可以看到
浅谈java指令重排序的问题

指令重排序是个比较复杂.觉得有些不可思议的问题,同样是先以例子开头(建议大家跑下例子,这是实实在在可以重现的,重排序的概率还是挺高的),有个感性的认识 /** * 一个简单的展示Happen-Before的例子. * 这里有两个共享变量:a和flag,初始值分别为0和false.在ThreadA中先给 a=1,然后flag=true. * 如果按照有序的话,那么在ThreadB中如果if(flag)成功的话,则应该a=1,而a=a*1之后a仍然为1,下方的if(a==0)应该永远不会为 * 真,
浅谈java异常处理之空指针异常

听老师说,在以后的学习中大部分的异常都是空指针异常.所以抽点打游戏的时间来查询一下什么是空指针异常一:空指针异常产生的主要原因如下: (1)当一个对象不存在时又调用其方法会产生异常obj.method() // obj对象不存在 (2)当访问或修改一个对象不存在的字段时会产生异常obj.method() // method方法不存在 (3)字符串变量未初始化: (4)接口类型的对象没有用具体的类初始化,比如: List lt:会报错 List lt = new ArrayList():则不会报
浅谈java 单例模式DCL的缺陷及单例的正确写法

1 前言单例模式是我们经常使用的一种模式,一般来说很多资料都建议我们写成如下的模式: /** * Created by qiyei2015 on 2017/5/13. */ public class Instance { private String str = ""; private int a = 0; private static Instance ins = null; /** * 构造方法私有化 */ private Instance(){ str = "hell
浅谈java基本数据类型的范围(分享)

如下所示: System.out.println("BYTE MAX_VALUE = " + Byte.MAX_VALUE); System.out.println("BYTE MIN_VALUE = " + Byte.MIN_VALUE); System.out.println("SHORT MAX_VALUE = " + Short.MAX_VALUE);//3万多,5位 System.out.println("SHORT MIN_
浅谈Java多线程实现及同步互斥通讯

Java多线程深入理解本文主要从三个方面了解和掌握多线程: 1. 多线程的实现方式,通过继承Thread类和通过实现Runnable接口的方式以及异同点. 2. 多线程的同步与互斥中synchronized的使用方法. 3. 多线程的通讯中的notify(),notifyAll(),及wait(),的使用方法,以及简单的生成者和消费者的代码实现. 下面来具体的讲解Java中的多线程: 一:多线程的实现方式通过继承Threa类来实现多线程主要分为以下三步: 第一步:继承 Thread,实现Thr

浅谈Java的虚拟机结构以及虚拟机内存的优化

相关推荐

随机推荐