C#内存管理CLR深入讲解(下篇)

《上篇》中我们主要讨论的是程序集(Assembly)和应用程序域(AppDomain)的话题,着重介绍了两个不同的程序集加载方式——独占方式和共享方式(中立域方式);以及基于进程范围内的字符串驻留。这篇将关注点放在托管对象创建时内存的分配和对大对象(LO:Large Object)的回收上,不对之处,还望各位能够及时指出。

一、从类型(Type)与实例(Instance)谈起

在面向对象的世界中,类型和实例是两个核心的要素。不论是类型和实例,相关的信息比如加载到内存中,对应着某一块或者多块连续或者不连续的内存。那么对类型和实例的内存分配时如何进行的呢?对象是“状态”和“行为”的组合体,所以从.NET Framework的角度来看类型,它只具有两种类型的成员——字段和方法(实际还有嵌套类型),前者表示状态,后者表示行为。类型是对元数据的描述,而实例则是符合该元数据描述的单个个体。同一个类型下的所有实例具有相同的行为,它们通过状态值的不同得以区分。所以内存中的实例(本篇所说的实例指代引用类型的实例)表示的是字段值,而内存中的类型表示的则是类型成员结构的元数据。很多人都知道,当我们创建一个对象的时候,CLR会在GC堆(Heap)中开辟一块连续的内存空间保存字段值。那么类型信息又是保存在那块内存上呢?

实际上,类型信息保存在“另一堆”上,我们称之为加载器堆(Loader Heap)。每一个应用程序域都具有各自的加载器堆,即包括我们创建的普通应用程序域,也包括《上篇》中提到的三个特殊应用程序域:系统程序域、共享程序域和默认程序域。如果说GC堆是实例的容器,那么基于应用程序域的加载器堆就是类型的容器。CLR采用“按需加载(这里指的是类型,不是程序集)、及时编译”的运行机制。当某个类型被第一次使用的时候,CLR试图加载该类型。如果该类型对应的程序没有独自地加载到本应用程序域中,或者没有通过中立域的形式加载到共享程序域中,它会按照相应的方式加载程序集(在这里我们假设采用独占方式加载)。然后,将使用到的这个类型加载到本应用程序域的加载器堆中。

加载器堆维护着自应用程序域创建以来使用过的所有类型记录,它们对应着一个特殊的对象——方法表(Method Table)。当程序第一次执行到某个方法的时候,CLR会定位到方法表中该条目,获取相关信息进行JIT编译。所以如果某个类型在加载器堆中的方法表的某个条目至少被执行一次,它就会指向一段JIT编译后的机器指令。

二、实例内存分配不仅限于GC堆

到现在为止,我们知道了类型和实例分别分配于基于应用程序域的加载器堆和GC堆中,那么CLR的内存分配仅仅限于这“两堆”吗?当然不是,除了这“两堆”以及默认的进程堆,还有额外“两堆”,一是存放JIT编译后机器指令的JIT堆(JIT Heap),另一个则是专门用于“大对象”的大对象堆(LOH: Large Object Heap)。下图反映了CLR主要维护的这些个不同的“堆”。

对于大对象堆,在本文后续部分还会讲述,在这里我们需要先了解CLR认为怎样的对象是“大对象”。当我们实例化一个对象的时候,如果该对象大于或者等于85,000字节(这种对象一般是数组,一般对象不会这么大),CLR将认为是“大对象”并被放到LOH中,否则放到GC堆中。这里有一点需要读者注意的是,作为垃圾回收器的GC并不仅仅限于针对GC堆中对象的回收,LOH中的对象的回收工作通过在GC的管辖之下。所以从某种意义上讲:你可以将之前提到的GC堆理解为SOH(Small Object Heap),或者称之为“狭义GC堆”,而将“广义GC堆”理解为SOH+LOH。

三、实例对类型的引用

实例是类型的实例,实例和它所对应的类型需要维持一种联系。反映在内存中,就以为着分配在GC堆或者是LOH中的对象具有一个对位于加载器堆中该类型的方法表的引用。实例对类型的引用通过一个特殊的对象来维系——TypeHandle。我们举个例子,在如下一段简单的对象实例化代码中 ,我先后实例化了四个对象:字符串“ABC”、System.Object对象、自定义Bar对象和具有85000个元素的字节数组。

string strInstance         = "ABC";
object objectInstance      = new object();
Bar barInstance            = new Bar()
byte[] largeObjInstance    = new byte[85000];

当上面的程序执行后,围绕着实例化的四个对象和类型信息,在内存中将会具有如下一个关系。最左边的是现成调用栈中的上述四个变量,对于字符串类型的strInstance,由于《上篇》所讲述的关于字符串驻留机制,最后总的字符串被分配到系统程序域中;Object和Bar类型的objectInstance与barInstance由于是小于85000字节的小对象,所以被分配到GC堆中。objectInstance通过TypeHandle指向位于共享程序域中System.Objhect类型对应的方法表(因为定义该类型的mscorlib程序集以中立域的方式加载),而barInstance得TypeHandle指向的基于Bar类型的方法表则位于默认程序域中(因为程序域默认采用独占的方式加载)。元素个数为85000的字节数组largeObjInstance属于大对象,直接分配到LOH中。largeObjInstance的TypeHandle指向的基于System.Byte[]类型的方法表,该System.Byte[]类型同样定义在mscorlib程序集中,所以该方法表同样存在于共享程序域的加载器堆。

四、LOH中的对象如何被回收

了解GC的读者应该都知道CLR采用基于“代龄(Generation)”的垃圾回收机制。代龄,个人觉得是一个很准确的词语,它充分体现了设计者用于表现“不同的对象具有不同生命周期”的意思。所有对象分三代,即G0、G1和G2,这实际上代表了三个不同的连续的内存块。“辈分”越高,表明时间越久;“辈分”越低,被扫荡(GC回收)的频率就越高。关于基于代龄的垃圾回收机制,限于篇幅,就说到这里。我们的重点是GC采用怎样的机制对LOH的对象进行回收。

到目前为止,对于LOH和GC堆中的对象,除了大小之外,我们好像没有觉得它们之间有何不同。实际上,将大对象放在LOH中,目的在于对其实施特殊的回收机制。关于垃圾收回,我们应该有这样的认知:回收的成本是和对象的大小基本成“正向”关系,对象越大,回收成本就越大。所以我们不能对大对象频繁地实施垃圾回收,实际上CLR是将LOH对象当成最高代龄的对象。也就是说,针对LOH的回收工作是和GC堆中G2一并进行的。换句话说,当G2或者LOH的剩余空间低于某个限度,针对它们的垃圾回收便被触发。关于LOH的垃圾回收机制,我们可以通过一个非常简单的程序来验证。

class Program
{
    static WeakReference SmallObjRef;
    static WeakReference LargeObjRef;

    static void Main(string[] args)
    {
        SetValues();
        GC.Collect(0);
        Console.WriteLine("GC.Collect(0)");
        Console.WriteLine("SmallObjRef.Target == null? {0}", SmallObjRef.Target == null);
        Console.WriteLine("LargeObjRef.Target == null? {0}\n", LargeObjRef.Target == null);

        GC.Collect(1);
        Console.WriteLine("GC.Collect(1)");
        Console.WriteLine("LargeObjRef.Target == null? {0}\n", LargeObjRef.Target == null);

        GC.Collect(2);
        Console.WriteLine("GC.Collect(2)");
        Console.WriteLine("LargeObjRef.Target == null? {0}\n", LargeObjRef.Target == null);
    }

    static void SetValues()
    {
        SmallObjRef = new WeakReference(new byte[84000]);
        LargeObjRef = new WeakReference(new byte[85000]);
    }
}

输出结果:

GC.Collect(0)
SmallObjRef.Target == null? True
LargeObjRef.Target == null? False

GC.Collect(1)
LargeObjRef.Target == null? False

GC.Collect(2)
LargeObjRef.Target == null? True

在上面的代码中没,我创建了两个WeakReference对象,它们的Target分别被设置成byte[84000]和byte[85000]。按照我们上面关于对“大对象”的界定,后者是大对象,前者不是。然后,我们先后三次对G0、G1和G2实施垃圾回收,我们发现“小对象”在实施针对G0的垃圾回收后就没了;而“大对象”会一直存活直到针对G2的垃圾回收被执行。

关于CLR内存管理一些深层次的讨论[上篇]

关于CLR内存管理一些深层次的讨论[下篇]

到此这篇关于C#内存管理CLR深入讲解(下篇)的文章就介绍到这了。希望对大家的学习有所帮助,也希望大家多多支持我们。

(0)

相关推荐

  • C#之CLR内存原理初探

    本文初步讲述了C#的CLR内存原理.这里所关注的内存里面说没有寄存器的,所以我们关注的只有托管堆(heap),栈(stack), 字符串常量池(其中string是一个很特殊的对象) 首先我们看两个方法: void M1() { string name = "Tom"; M2(name); } void M2(string name2) { int length = 10; double rate = 10.0; name2 = "Joe"; return; } 这里

  • C#之CLR内存深入分析

    本文不再对值类型进行讨论,主要讨论一下引用类型.如要看内存值类型的朋友可以看一下前一篇C#之CLR内存原理初探. C#引用类型具体分析如下: 先来装备两个类: internal class Employee { public static Employee LookUp(string name) { return null; } public virtual string GetProgressReport() { return string.Empty; } } internal class

  • C#之CLR内存字符串常量池(string)

    C#中的string是比特殊的类,说引用类型,但不存在堆里面,而且String str=new String("HelloWorld")这样的重装也说没有的. 我们先来看一个方法: class Program { static void Main(string[] args) { String s = "HelloWorld"; Console.WriteLine(s); } } 然后我们用ildasm.exe工具把它生成IL语言来看一看它里面是怎么玩的: .met

  • C#内存管理CLR深入讲解(上篇)

    半年之前,PM让我在部门内部进行一次关于“内存泄露”的专题分享,我为此准备了一份PPT.今天无意中将其翻出来,觉得里面提到的关于CLR下关于内存管理部分的内存还有点意思.为此,今天按照PPT的内容写了一篇文章.本篇文章不会在讨论那些我们熟悉的话题,比如“值类型引用类型具有怎样的区别?”.“垃圾回收分为几个步骤?”.“Finalizer和Dispose有何不同”.等等,而是讨论一些不同的内容.整篇文章分上下两篇,上篇主要谈论的是“程序集(Assembly)和应用程序域(AppDomain)”.也许

  • C#内存管理CLR深入讲解(下篇)

    <上篇>中我们主要讨论的是程序集(Assembly)和应用程序域(AppDomain)的话题,着重介绍了两个不同的程序集加载方式——独占方式和共享方式(中立域方式):以及基于进程范围内的字符串驻留.这篇将关注点放在托管对象创建时内存的分配和对大对象(LO:Large Object)的回收上,不对之处,还望各位能够及时指出. 一.从类型(Type)与实例(Instance)谈起 在面向对象的世界中,类型和实例是两个核心的要素.不论是类型和实例,相关的信息比如加载到内存中,对应着某一块或者多块连续

  • C语言可变参数与内存管理超详细讲解

    目录 概述 动态分配内存 重新调整内存的大小和释放内存 概述 有时,您可能会碰到这样的情况,您希望函数带有可变数量的参数,而不是预定义数量的参数.C 语言为这种情况提供了一个解决方案,它允许您定义一个函数,能根据具体的需求接受可变数量的参数.下面的实例演示了这种函数的定义. int func(int, ... ) { . . . } int main() { func(2, 2, 3); func(3, 2, 3, 4); } 请注意,函数func()最后一个参数写成省略号,即三个点号(...)

  • C语言数据的存储超详细讲解下篇浮点型在内存中的存取

    目录 前言 浮点型在内存中的存储 浮点数存储的例子 浮点数存储规则 IEEE 754规定 IEEE 754对有效数字M的特别规定 IEEE 754对指数E的特别规定 存入内存是E的规定 从内存取出时E的规定 举例 1 举例 2 举例 3 判断两个浮点数是否相等? 总结 前言 本文接着学习数据的存储相关的内容,主要学习浮点型数在内存中的存储与取出. 浮点型在内存中的存储 常见的浮点数:3.14159.1E10 浮点数家族包括: float.double.long double 类型 浮点数表示的范

  • C语言深入细致讲解动态内存管理

    目录 为什么存在动态内存管理 动态内存函数的介绍 malloc free calloc realloc 常见的动态内存错误 对NULL指针的解引用操作 对动态开辟空间的越界访问 对非动态开辟内存使用free访问 使用free 释放一块动态开辟内存的一部分 对一块动态内存多次释放 对动态内存开辟忘记释放 柔性数组 小结 为什么存在动态内存管理 我们已经掌握的内存开辟方式有: int val = 20;//在栈空间上开辟四个字节 char arr[10] = { 0 };//在栈空间上开辟10个字节

  • C语言详细分析讲解内存管理malloc realloc free calloc函数的使用

    目录 C语言内存管理 一.动态空间申请 二.动态空间的扩容 三.释放内存 C语言内存管理 malloc && realloc && free && calloc c语言中为了进行动态内存管理,<stdlib.h>中提供了几个函数帮助进行内存管理. 我们知道,C语言中是没有C++中的容器或者说是python中list,set这些高级的数据结构的,我们一旦申请了一段内存空间以后这一段空间就归你了,比如我们举个例子,我们申请一个数组 int nums[

  • C++全面覆盖内存管理知识讲解

    目录 前言 一.C++内存管理方式 1.1new/delete操作内置类型 二.operator new与operator delete函数 2.1operator new与operator delete函数 二.new和delete的实现原理 2.1内置类型 2.2 自定义类型 前言 C语言内存管理方式在C++中可以继续使用,但有些地方就无能为力而且使用起来比较麻烦,因此C++又提出了自己的内存管理方式:通过new和delete操作符进行动态内存管理. 一.C++内存管理方式 1.1new/d

  • C++详细讲解内存管理工具primitives

    目录 primitives new 和 delete placement new 重载 operator new per-class allocator New Handler =default,=delete primitives 分配 释放 属于 是否可重载 malloc() free() C 不可 new delete C++表达式 不可 ::operator new() ::operator delete() C++函数 可 allocator::allocate() allocator

  • Python超详细讲解内存管理机制

    目录 什么是内存管理机制 一.引用计数机制 二.数据池和缓存 什么是内存管理机制 python中创建的对象的时候,首先会去申请内存地址,然后对对象进行初始化,所有对象都会维护在一 个叫做refchain的双向循环链表中,每个数据都保存如下信息: 1. 链表中数据前后数据的指针 2. 数据的类型 3. 数据值 4. 数据的引用计数 5. 数据的长度(list,dict..) 一.引用计数机制 引用计数增加: 1.1 对象被创建 1.2 对象被别的变量引用(另外起了个名字) 1.3 对象被作为元素,

  • Python万字深入内存管理讲解

    目录 Python内存管理 一.对象池 1.小整数池 2.大整数池 3.inter机制(短字符串池) 二.垃圾回收 2.1.引用计数 2.1.1 引用计数增加 2.1.2 引用计数减少 2.2.标记清除 2.3.分代回收 2.3.1 分代回收触发时机?(GC阈值) 2.3.2 查看引用计数(gc模块的使用) 三.怎么优化内存管理 1.手动垃圾回收 2.调高垃圾回收阈值 3.避免循环引用 四.总结 Python内存管理 一.对象池 1.小整数池 系统默认创建好的,等着你使用 概述: 整数在程序中的

随机推荐