JVM中的GC初识

2025-02-23 22:54:52

GC简介

何为GC

GC（Garbage Collection）称之为垃圾回收，是对内存中的垃圾对象,采用一定的算法进行内存回收的一个动作。比方说，java中的垃圾回收会对内存中的对象进行遍历，对存活的对象进行标记，其未标记对象可认为是垃圾对象，然后基于特定算法进行回收。

为何要学习GC

深入理解GC的工作机制，可以帮你写出更好的Java应用，提高开发效率，同时也是进军大规模应用开发的一个前提。

GC垃圾对象判定

引用计数法

这个算法是给每一个对象设置一个引用计数器，每当有一个地方引用这个对象的时候，计数器就加 1，与之相反，每当引用失效的时候就减 1。也就是以计数来判断对象是否为垃圾。当某个对象的引用计数器的值为0时，表示这个对象不会在被实用，JVM中的GC被触发时，可回收这个对象。如图所示：

其中：

绿色云朵是内存中的根对象，表示程序中正在使用的对象。
蓝色圆圈是内存中的活动对象，其中的数字表示其引用计数。
灰色圆圈是内存中没有活动对象引用的对象，表示非活动对象。

对于引用计数法，实现简单，垃圾对应也便于识别。但也有一些缺陷，我们每个对象都需要有一个单独的对象引用计数器，这个计数器的值还要经常更新，还有就是有一个最严重的循环引用问题，如图所示：

其中红色对象实际上是应用程序不使用的垃圾。但由于引用计数的限制，仍然存在内存泄漏。当然也有一些办法来应来对这种情况, 例如 “弱引用”(‘weak’ references)或者使用其它的算法来排查循环引用等。

可达性分析法

这个算法的核心思路就是通过一系列的“GC Roots”对象作为起始点，从这些对象开始往下搜索，搜索所经过的路径称之为“引用链”。当一个对象到 GC Roots 没有任何引用链相连的时候，证明此对象是可以被回收的。否则，证明这个对象有用，不是垃圾。如图所示：

在GC遍历(traverses)内存中整体的对象关系图(object graph)时，首先要确定根对象,那什么样的对象可作为根对象呢？GC规范中指出根对象可以是：

1）Java 虚拟机栈中的引用对象；
2）本地方法栈中 JNI（既一般说的 Native 方法）引用的对象；
3）方法区中类静态常量的引用对象；
4）方法区中常量的引用对象。

当确定了根对象以后，进而从根对象开始进行依赖查找，所有可访问到的对象都认为是存活对象，然后进行标记（mark）。

说明：标记可达对象需要暂停所有应用线程, 以确定对象的引用关系。其暂停的时间, 与堆内存大小、对象的总数没有直接关系, 而是由存活对象(alive objects)的数量来决定。

常见GC算法分析

标记清除

标记清除(Mark-Sweep)算法分为“标记”和“清除”阶段，它首先会标记出内存中所有不需要回收的对象，然后从内存中清除所有未标记的对象。如图所示：

标记清除算法的的优点是简单直接，缺点是效率低，并且可能会产生大量不连续的碎片。说它效率低是因为标记和清除两个过程都需要扫描内存空间（第一次：标记存活对象，第二次：清除没有标记的对象）。还有就是，清除后产生的大量不连续的内存碎片空间，无法满足较大对象的存储需求，这样就可能会再次触发垃圾回收。所以此垃圾回收算法，应该适合对象存活率较高的的内存区域(比方说JVM中的老年代)。

标记复制

标记复制（Mark-Copy）算法是将内存分为大小相同的两块，当这一块使用完了，就把当前存活的对象复制到另一块，然后一次性清空当前区块。如图所示：

“标记-复制”算法的缺点显而易见，就是内存空间利用率低，适用于那些对象生命周期短、回收频率高的内存区域（比方说JVM中的年轻代）。

标记整理

标记整理清除(Mark-Sweep-Compact)算法结合了“标记-清除”和“复制”两个算法的优点。第一阶段从根节点开始标记所有被引用对象，第二阶段遍历整个堆，把存活对象“压缩”复制到堆的其中一块空间中，按顺序排放。第三阶段清理掉存活边界以外的全部内存空间。如图所示：

系统GC时每次执行清除(sweeping)操作, JVM 都必须保证“不可达对象“占用的内存能被回收然后重用。内存是被回收了，但这有可能会产生大量的内存碎片(类似于磁盘碎片), 进而引发两个问题:

对象创建时，执行写入操作越来越耗时, 因为寻找一块足够大的空闲内存会变得更加麻烦。
对象创建时, JVM需要在连续的内存块中为对象分配内存。如果碎片问题很严重, 直至没有空闲片段能存放新创建的对象,就会发生内存分配错误(allocation error)。

为了解决碎片问题，JVM在启动GC执行垃圾收集的过程中, 不仅仅是标记和清除, 还需要执行 “内存碎片整理”。这个过程会让所有可达对象(reachable objects)进行依次移动,进而可以消除(或减少)内存碎片，并为新对象提供更大并且连续的内存空间。

标记整理算法避免了“标记-清除”的碎片问题，同时也避免了“复制”算法的空间问题,由于需要向一侧移动等一系列操作，其效率相对低一些，但对内存空间管理上十分优异。适用于那些生命周期长、回收频率低，但注重回收一次内存空间得到足够释放的场景。

分代回收

我们知道垃圾收集要停止整个应用程序的运行，那么假如这个收集过程需要的时间很长，就会对应用程序产生很大性能问题，如何解决这个问题呢？通过实验发现内存中的对象通常可以将其分为两大类：

存活时间较短(这样的对象比较多)。
存活时间较长(这样的对象比较少)。

基于对如上问题的分析，科学家提出了分代回收思路，将VM中内存分为年轻代(Young Generation)和老年代(Old Generation-老年代有时候也称为年老区(Tenured)。例如：

Young区存储的就是那些生命周期短，使用一两次就不再使用的对象，回收一次基本上该区域十之有八的对象全部被回收清理掉，因此Young区采用的垃圾回收算法也就是“标记-复制”算法。Old区存储的是那些生命周期长，经过多次回收后仍然存活的对象，就把它们放到Old区中，Old区一般不去判断这些对象的可达性，直到Old区不够用为止，再进行一次统一的回收，释放出足够的连续的内存空间。所以我们选择“标记-清除”或“标记-整理”算法进行垃圾收集。

在分代回收过程中，垃圾收集事件(Garbage Collection events)通常分为:

Minor GC （小型GC）：年轻代GC事件，(新对象)分配频率越高, Minor GC 的频率就越高。
Major GC (大型GC): 老年代GC事件。
Full GC （完全GC）:整个堆的GC事件。

说明：一般情况下可以将Major GC与Full GC看成是同一种GC。

章节面试分析

1)何为GC？
2)为什么要GC？
3)如何判定内存中的对象是否为垃圾对象？
4)常用垃圾回收算法有哪些？

到此这篇关于JVM中的GC初识的文章就介绍到这了,更多相关初识JVM中的GC内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

java基础学习JVM中GC的算法

在java学习到JVM时候,总会很多朋友问到关于GC算法的问题,小编在此给大家整理关于JVM中GC算法的原理以及图文详细分析,希望能够帮助你对这个GC算法的理解. JVM内存组成结构: (1)堆所有通过new创建的对象都是在堆中分配内存,其大小可以通过-Xmx和-Xms来控制,堆被划分为新生代和旧生代,新生代又被进一步划分为Eden和Survivor区.Survivor被划分为from space 和 to space组成,结构图如下: (2)栈每个线程执行每个方法的时候都会在栈中申请一个
使用JVM常用GC日志打印参数

目录 JVM常用GC日志打印参数 1. PrintGC 2. PrintGCDetails 3. PrintGCTimeStamps 4. PrintGCApplicationStoppedTime 5. PrintGCApplicationConcurrentTime 6. PrintHeapAtGC JVM打印GC日志到文件 JVM常用GC日志打印参数 1. PrintGC 最简单的GC参数. 启用配置:-XX:+PrintGC 日志如下: 根据上面红色方框内的数字1.2.3.4.5说明,1
详解JVM中的GC调优

那些GC的默认值其实GC或者说JVM的参数非常非常的多,有控制内存使用的: 有控制JIT的: 有控制分代比例的,也有控制GC并发的: 当然,大部分的参数其实并不需要我们自行去调整,JVM会很好的动态帮我们设置这些变量的值. 如果我们不去设置这些值,那么对GC性能比较有影响的参数和他们的默认值有哪些呢? GC的选择我们知道JVM中的GC有很多种,不同的GC选择对java程序的性能影响还是比较大的. 在JDK9之后,G1已经是默认的垃圾回收器了. 我们看一下G1的调优参数. G1是基于分代技术的
jvm垃圾回收之GC调优工具分析详解

进行GC性能调优时, 需要明确了解, 当前的GC行为对系统和用户有多大的影响.有多种监控GC的工具和方法, 本章将逐一介绍常用的工具. JVM 在程序执行的过程中, 提供了GC行为的原生数据.那么, 我们就可以利用这些原生数据来生成各种报告.原生数据(raw data) 包括: 各个内存池的当前使用情况, 各个内存池的总容量, 每次GC暂停的持续时间, GC暂停在各个阶段的持续时间. 可以通过这些数据算出各种指标, 例如: 程序的内存分配率, 提升率等等.本章主要介绍如何获取原生数据. 后续的章
JVM完全解读之GC日志记录分析

相信大家在系统学习jvm的时候都会有遇到过这样的问题,散落的jvm知识点知道很多,但是真正在线上环境遇到一些莫名其妙的gc异常时候却无从下手去分析. 关于这块的苦我也表示能够理解,之前光是JVM相关的八股文就整理了许多,但是经常是不知道如何在实战中使用.最近也尝试在模拟一些案例来训练自己的JVM相关知识,本文特意记录下这段调优经历. Java应用的GC评估可能大多数程序员在开发完某个需求之后,往线上环境一丢,然后就基本不怎么关注后续的变化了.但是是否有考虑过,这些新引入的代码会对原有系统造成的
GC参考手册jvm垃圾回收详解

1,什么是垃圾回收? 顾名思义,垃圾收集(Garbage Collection)的意思就是 —— 找到垃圾并进行清理.但现有的垃圾收集实现却恰恰相反: 垃圾收集器跟踪所有正在使用的对象,并把其余部分当做垃圾我们不抠细节, 先从基础开始, 介绍垃圾收集的一般特征.核心概念以及实现算法. 2,手动内存管理(Manual Memory Management) 当今的自动垃圾收集算法极为先进, 但我们先来看看什么是手动内存管理.在那个时候, 如果要存储共享数据, 必须显式地进行内存分配(alloca
JVM中的GC初识

目录 GC简介何为GC 为何要学习GC GC垃圾对象判定引用计数法可达性分析法常见GC算法分析标记清除标记复制标记整理分代回收章节面试分析 GC简介何为GC GC(Garbage Collection)称之为垃圾回收,是对内存中的垃圾对象,采用一定的算法进行内存回收的一个动作.比方说,java中的垃圾回收会对内存中的对象进行遍历,对存活的对象进行标记,其未标记对象可认为是垃圾对象,然后基于特定算法进行回收. 为何要学习GC 深入理解GC的工作机制,可以帮你写出更好的Java应
你知道JVM中GC Root对象有哪些吗

目录 JVM中GC Root对象有哪些 (一)虚拟机栈中引用的对象 (二)方法区中类静态属性引用的对象 (三)方法区中常量引用的对象 (四)本地方法栈中引用的对象 JVM 中的 GC Roots 和可达链什么是GC Root 对象? 常用的GC算法 GC Root 对象有哪些? 总结 JVM中GC Root对象有哪些众所周知,我们目前最常用的虚拟机hotspot使用可达性分析来进行垃圾回收,而可达性分析需要依赖GC Root. 下面我就来介绍下可以作为GC Root的对象. (一)虚拟机栈中
JVM中四种GC算法案例详解

目录介绍引用计数算法(Reference counting) 算法思想: 核心思想: 优点: 缺点: 例子如图: 标记–清除算法(Mark-Sweep) 算法思想: 优点缺点例子如图标记–整理算法算法思想优点缺点例子复制算法算法思想优点缺点总结介绍程序在运行过程中,会产生大量的内存垃圾(一些没有引用指向的内存对象都属于内存垃圾,因为这些对象已经无法访问,程序用不了它们了,对程序而言它们已经死亡),为了确保程序运行时的性能,java虚拟机在程序运行的过程中不断地进行
快速理解Java垃圾回收和jvm中的stw

Java中Stop-The-World机制简称STW,是在执行垃圾收集算法时,Java应用程序的其他所有线程都被挂起(除了垃圾收集帮助器之外).Java中一种全局暂停现象,全局停顿,所有Java代码停止,native代码可以执行,但不能与JVM交互:这些现象多半是由于gc引起. GC时的Stop the World(STW)是大家最大的敌人.但可能很多人还不清楚,除了GC,JVM下还会发生停顿现象. JVM里有一条特殊的线程--VM Threads,专门用来执行一些特殊的VM Operation
浅谈jvm中的垃圾回收策略

java和C#中的内存的分配和释放都是由虚拟机自动管理的,此前我已经介绍了CLR中GC的对象回收方式,是基于代的内存回收策略,其实在java中,JVM的对象回收策略也是基于分代的思想.这样做的目的就是为了提高垃圾回收的性能,避免对堆中的所有对象进行检查时所带来的程序的响应的延迟,因为jvm执行GC时,会stop the word,即终止其它线程的运行,等回收完毕,才恢复其它线程的操作.基于分代的思想是:jvm在每一次执行垃圾收集器时,只是对一小部分内存对象引用进行检查,这一小部分对象的生命周
JVM中的守护线程示例详解

前言在Java中有两类线程:User Thread(用户线程).Daemon Thread(守护线程) 用个比较通俗的比如,任何一个守护线程都是整个JVM中所有非守护线程的保姆: 只要当前JVM实例中尚存在任何一个非守护线程没有结束,守护线程就全部工作:只有当最后一个非守护线程结束时,守护线程随着JVM一同结束工作. Daemon的作用是为其他线程的运行提供便利服务,守护线程最典型的应用就是 GC (垃圾回收器),它就是一个很称职的守护者. 在之前的<详解JVM如何处理异常>提到了守护线程,
java中JVM中如何存取数据和相关信息详解

前言: 我们每天都在编写Java代码,编译,执行.很多人已经知道Java源代码文件(.java后缀)会被Java编译器编译为字节码文件(.class后缀),然后由JVM中的类加载器加载各个类的字节码文件,加载完毕之后,交由JVM执行引擎执行. 那在整个程序执行过程中,JVM中怎么存取数据和相关信息呢? 事实上在JVM中是用一段空间来存储程序执行期间需要用到的数据和相关信息,这段空间一般被称作为Runtime Data Area(运行时数据区),也就是我们常说的JVM内存. 一.运行时数据区域包括
详解JVM中的本机内存跟踪

1.概述有没有想过为什么Java应用程序通过众所周知的-Xms和-Xmx调优标志消耗的内存比指定数量多得多?出于各种原因和可能的优化,JVM可以分配额外的本机内存.这些额外的分配最终会使消耗的内存超出-Xmx限制. 在本教程中,我们将列举JVM中的一些常见内存分配源,以及它们的大小调整标志,然后学习如何使用本机内存跟踪监视它们. 2.原生分配堆通常是Java应用程序中最大的内存使用者,但还有其他人.除了堆之外,JVM还从本机内存中分配出一个相当大的块来维护类的元数据,应用程序代码,JIT生成