关于C++虚继承的内存模型问题

1、前言

C++虚继承的内存模型是一个经典的问题,其具体实现依赖于编译器,可能会出现较大差异,但原理和最终的目的是大体相同的。本文将对g++中虚继承的内存模型进行详细解析。

2、多继承存在的问题

C++的多继承是指从多个直接基类中产生派生类的能力,多继承的派生类继承了所有父类的成员。从概念上来讲这是非常简单的,但是多个基类的相互交织可能会带来错综复杂的设计问题,命名冲突就是不可回避的一个,比如典型的是菱形继承,如图2-1所示:

图2-1 菱形继承

在图2-1中,类A派生出类B和类C,类D继承自类B和类C,这个时候类A中的成员变量和成员函数继承到类D中变成了两份,一份来自A–>B–>D这条路径,另一份来自A–>C–>D这条路径。
在一个派生类中保留间接基类的多份同名成员,虽然可以在不同的成员变量中分别存放不同的数据,但大多数情况下这是多余的,因为保留多份成员变量不仅占用较多的存储空间,还容易产生命名冲突。假如类A有一个成员变量a,那么在类D中直接访问a就会产生歧义,编译器不知道它究竟来自A -->B–>D这条路径,还是来自A–>C–>D这条路径。下面是菱形继承的代码实现:

#include <iostream>
#include <stdint.h>

class A
{
public:
    long a;
};

class B: public A
{
public:
    long b;
};

class C: public A
{
public:
    long c;
};

class D: public B, public C
{
public:
    void seta(long v) { a = v; } // 命名冲突
    void setb(long v) { b = v; } // 正确
    void setc(long v) { c = v; } // 正确
    void setd(long v) { d = v; } // 正确

private:
    long d;
};

int main(int argc, char* argv[])
{
    D d;
}

这段代码就是图2-1所示的菱形继承的具体实现,可以看到在类Dseta()方法中,代码试图直接访问间接基类的成员变量a,结果发生了错误,因为类B和类C中都有成员变量a(都是从类A继承的),编译器不知道选用哪一个,所以产生了歧义。

为了消除歧义,我们可以在使用a时指明它具体来自哪个类,代码如下:

void seta(long v) { B::a = v; }
/* 或 */
void seta(long v) { C::a = v; }

使用GDB查看变量d的内存布局,如图2-2所示:

图2-2 变量d的GDB调试结果

于是我们可以画出变量d的内存布局,如图2-3所示:

图2-3 变量d的内存布局

3、虚继承简介

为了解决多继承时命名冲突和冗余数据的问题,C++提出了虚继承这个概念,虚继承可以使得在派生类中只保留一份间接基类的成员。使用方式就是在继承方式前面加上virtual关键字修饰,示例代码如下(基于前面的例子修改):

#include <iostream>
#include <stdint.h>

class A
{
public:
    long a;
};

class B: virtual public A
{
public:
    long b;
};

class C: virtual public A
{
public:
    long c;
};

class D: public B, public C
{
public:
    void seta(long v) { a = v; } // 现在不会冲突了
    void setb(long v) { b = v; } // 正确
    void setc(long v) { c = v; } // 正确
    void setd(long v) { d = v; } // 正确

private:
    long d;
};

int main(int argc, char* argv[])
{
    D d;
}

可以看到这段代码使用虚继承重新实现了前面提到的那个菱形继承,这样在派生类D中就只保留了一份间接基类A的成员变量a了,后续再直接访问a就不会出现歧义了。虚继承的目的是让某个类做出声明,承诺愿意共享它的基类,这个被共享的基类就称为虚基类(Virtual Base Class),本例中的类A就是一个虚基类。在这种机制下,不论虚基类在继承体系中出现了多少次,在派生类中都只包含一份虚基类的成员。本例的继承关系如图3-1所示:

图3-1 虚继承下菱形继承

从这个新的继承体系中我们可以发现虚继承的一个特征:必须在虚派生的真实需求出现前就已经完成虚派生的操作。在图3-1中,我们是当定义类D时才出现了对虚派生的需求,但是如果类B和类C不是从类A虚派生得到的,那么类D还是会保留间接基类A的两份成员,示例代码如下:

#include <iostream>
#include <stdint.h>

class A
{
public:
    long a;
};

class B: public A
{
public:
    long b;
};

class C: public A
{
public:
    long c;
};

class D: virtual public B, virtual public C
{
public:
    void seta(long v) { a = v; } // 错误,不能等到定义类D时再来做虚继承的工作
    void setb(long v) { b = v; } // 正确
    void setc(long v) { c = v; } // 正确
    void setd(long v) { d = v; } // 正确

private:
    long d;
};

int main(int argc, char* argv[])
{
    D d;
}

换个角度讲,虚派生只影响从指定了虚基类的派生类中进一步派生出来的类,它不会影响派生类本身。在实际开发中,位于中间层次的基类将其继承声明为虚继承一般不会带来什么问题。通常情况下,使用虚继承的类层次是由一个人或者一个项目组一次性设计完成的。对于一个独立开发的类来说,很少需要基类中的某一个类是虚基类,况且新类的开发者也无法改变已经存在的类体系。

4、虚继承在标准库中的使用

C++标准库中的iostream就是一个虚继承的典型案例。iostream是从istreamostream直接继承而来的,而istreamostream又都继承自一个名为ios的类,这个就是一个典型的菱形继承。此时istreamostream必须采用虚继承,否则将导致iostream中保留两份ios的成员。

iostream相关的源代码如下(从gcc-2.95.3版本中摘录出来的,内容有所省略):

struct _ios_fields
{ // The data members of an ios.
    streambuf *_strbuf;
    ostream* _tie;
    int _width;
    __fmtflags _flags;
    _IO_wchar_t _fill;
    __iostate _state;
    __iostate _exceptions;
    int _precision;

    void *_arrays; /* Support for ios::iword and ios::pword. */
};

class ios : public _ios_fields
{...};

class istream : virtual public ios
{...};

class ostream : virtual public ios
{...};

class iostream : public istream, public ostream
{
public:
    iostream() { }
    iostream(streambuf* sb, ostream*tied=NULL);
};

5、虚继承下派生类的内存布局解析

g++中是没有所谓的虚基类表的(据说vs是有单独一个虚基类表的),只有一个虚表,由于平时用的比较多的是虚函数,所以一般情况下都直接管它叫做虚函数表,在g++编译环境下这种叫法其实是不严谨的。测试程序如下:

#include <iostream>
#include <stdint.h>

class A
{
public:
    long a;
};

class B: virtual public A
{
public:
    long b;
};

class C: virtual public A
{
public:
    long c;
};

class D: public B, public C
{
public:
    void seta(long v) { a = v; }
    void setb(long v) { b = v; }
    void setc(long v) { c = v; }
    void setd(long v) { d = v; }

private:
    long d;
};

int main(int argc, char* argv[])
{
    D d;
    d.seta(1);
    d.setb(2);
    d.setc(3);
    d.setd(4);
}

D在当前编译器(GCC 4.8.5)下的内存布局如图5-1所示:

图5-1 类D的内存布局

从图5-1中可以看出这个表和之前这篇文章《一文读懂C++虚函数的内存模型》讲的虚函数表是差不多的,就多了一个vbase_offset而已。因为这里的类设计比较简单,没有把虚函数加进来,有虚函数的话_vptr.B或者_vptr.C下面的内存空间存储的就是指向对应虚函数的指针了(以下只讲_vptr.B的相关内容,_vptr.C同理就不赘述了)。

这里可以看到_vptr.B指向的是虚函数的起始地址(因为这里没有虚函数,所以下面紧接着就是_vptr.C的内容),而不是与它相关联的全部信息的起始地址,事实上从图5-1中可以看出_vptr.B - 3 ~ _vptr.B这个范围内的数据都是类B虚表的内容(不知道编译器为什么这么设计,这里也进行揣测了),这三个特殊的内存地址存储的内容解析如下:

_vptr.B - 1:这里存储的是typeinfo for D,里面的内容其实也是一个指针,指向的是类D的运行时信息,这些玩意都是为了支持RTTI的。RTTI的相关内容以后会讲,这里就先不多分析了。_vptr.B - 2:这里存储的是offset_to_top,这个表示的是当前的虚表指针距离类开头的距离,可以看到对于_vptr.B来说这个值就是0,因为_vptr.B就存在于类D的起始位置,而对于_vptr.C来说这个值是-16,大家可以算一下_vptr.C与类D的起始位置确实是差两个地址也就是16个字节(64位系统),至于为什么是负数,这是因为堆内存是向下增长的,越往下地址数值越大。

offset_to_top深度解析:在多继承中,由于不同基类的起点可能处于不同的位置,因此当需要将它们转化为实际类型时,this指针的偏移量也不相同。由于实际类型在编译时是未知的,这要求偏移量必须能够在运行时获取。实体offset_to_top表示的就是实际类型起始地址到当前这个形式类型起始地址的偏移量。在向上动态转换到实际类型时(即基类转派生类),让this指针加上这个偏移量即可得到实际类型的地址。需要注意的是,由于一个类型即可以被单继承,也可以被多继承,因此即使只有单继承,实体offset_to_top也会存在于每一个多态类型之中。
(这里要注意一点就是offset_to_top只存在于多态类型中,所以我们可以看到在第二小节那个例子中,根本就没有什么所谓的虚表之类的东西,它也就不支持RTTI,最简单的大家可以使用dynamic_cast去试试,会报错说该类型不具备多态性质的。那么问题来了,怎样才能以最简短的方式让它具备多态的性质呢?很简单,定义一个析构函数,用virtual修饰即可)

_vptr.B - 3:这里存储的是vbase_offset,这个表示的是当前虚表指针与其对应的虚基类的距离。从图中可以看出对于_vptr.B来说这个值是40,算一下刚好是_vptr.Ba的差距,_vptr.C同理。

vbase_offset深度解析:以测试程序为例,对于类型为B的引用,在编译时,无法确定它的虚基类A它在内存中的偏移量。因此,需要在虚表中额外再提供一个实体,表明运行时它的基类所在的位置,这个实体称为vbase_offset,位于offset_to_top上方。

接下来我们通过GDB来验证一下前面讲的内容,先打印出变量d的内存信息,如图5-2所示:

图5-2 变量d的内存信息

从图5-2中可以看到变量d的内容与前面分析的差不多,接下来我们来看一下这两个虚表的内容,如图5-3所示:

图5-3 虚表内存信息

从图5-3中可以看出前面的内存图是正确的,接下来就再看一下变量d自身的内存布局,如图5-4所示:

图5-4 变量d的内存布局

图5-4显示出的结果和前面图5-1的完全一致,到这里调试就结束了,由调试结果可以知道图5-1的内存模型是正确的。

这里要补充一点,就是对于虚继承下的类D,和第二节那个没有虚继承的相比,基类A的位置被移动到了类D的最末尾,不过不用担心,运行时可以靠vbase_offset找到它。

6、总结

本文先是对虚继承的概念以及使用场景进行了说明,然后通过一个内存模型图向大家展示了g++下虚继承的内存形态,最后使用GDB查看实际的内存情况来验证内存模型图的正确性。本文为了更直观地展示虚继承的内存模型,示例设计得很简单,类的设计中只有一个成员变量而没有成员函数、虚函数等其它内容。本文与前文《一文读懂C++虚函数的内存模型》相当于抛砖引玉,为下文作铺垫,在下一篇文章中我将对一些稍微复杂一点的情景进行分析,看看完整形态的虚表究竟是什么样的。

到此这篇关于关于C++虚继承的内存模型问题的文章就介绍到这了,更多相关C++虚继承的内存模型内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • C++多重继承与虚继承分析

    本文以实例形式较为全面的讲述了C++的多重继承与虚继承,是大家深入学习C++面向对象程序设计所必须要掌握的知识点,具体内容如下: 一.多重继承 我们知道,在单继承中,派生类的对象中包含了基类部分 和 派生类自定义部分.同样的,在多重继承(multiple inheritance)关系中,派生类的对象包含了每个基类的子对象和自定义成员的子对象.下面是一个多重继承关系图: class A{ /* */ }; class B{ /* */ }; class C : public A { /* */ }

  • 关于C++中菱形继承和虚继承的问题总结

    前言 菱形继承是多重继承中跑不掉的,Java拿掉了多重继承,辅之以接口.C++中虽然没有明确说明接口这种东西,但是只有纯虚函数的类可以看作Java中的接口.在多重继承中建议使用"接口",来避免多重继承中可能出现的各种问题.本文将给大家详细介绍关于C++菱形继承和虚继承的相关内容,分享出来供大家参考学习,话不多说了,来一起看看详细的介绍吧. 继承: 1. 单继承–一个子类只有一个直接父类时称这个继承关系为单继承 2. 多继承–一个子类有两个或以上直接父类时称这个继承关系为多继承 例如下面

  • c++基础语法:虚继承

    虚继承 的概念的提出主要是为了解决C++多继承的问题,举个最简单的例子: 复制代码 代码如下: class animal{        public :              void op()                  {cout << "hello animal" ;} };class tiger : public animal {        public :              void tg()                  {cout

  • c++ 虚继承,多继承相关总结

    看这一篇文章之前强烈建议先看以下我之前发布的 虚指针,虚函数剖析 例1: 以下代码输出什么? #include <iostream> using namespace std; class A { protected: int m_data; public: A(int data = 0) {m_data=data;} int GetData() { return doGetData(); } virtual int doGetData() { return m_data; } }; class

  • 关于C++虚继承的内存模型问题

    1.前言 C++虚继承的内存模型是一个经典的问题,其具体实现依赖于编译器,可能会出现较大差异,但原理和最终的目的是大体相同的.本文将对g++中虚继承的内存模型进行详细解析. 2.多继承存在的问题 C++的多继承是指从多个直接基类中产生派生类的能力,多继承的派生类继承了所有父类的成员.从概念上来讲这是非常简单的,但是多个基类的相互交织可能会带来错综复杂的设计问题,命名冲突就是不可回避的一个,比如典型的是菱形继承,如图2-1所示: 图2-1 菱形继承 在图2-1中,类A派生出类B和类C,类D继承自类

  • C++虚继承的实现原理由内存布局开始讲起

    目录 准备工作 虚继承的内存分布情况 准备工作 1.VS2012使用命令行选项查看对象的内存布局 微软的Visual Studio提供给用户显示C++对象在内存中的布局的选项:/d1reportSingleClassLayout.使用方法很简单,直接在[工具(T)]选项下找到“Visual Studio命令提示(C)”后点击即可.切换到cpp文件所在目录下输入如下的命令即可 c1 [filename].cpp /d1reportSingleClassLayout[className] 其中[fi

  • C++ 继承,虚继承(内存结构)详解

    目录 普通的公有继承 多重继承 虚继承 虚继承(菱形继承) 总结 普通的公有继承 class test1 { public: test1(int i) :num1(i) {} private: int num1; }; class test2 : public test1 { public: test2(int i,int j) : test1(i), num2(j) { } private: int num2; }; void main() { test2 t2(1,2); } (test2内

  • C++详细讲解继承与虚继承实现

    目录 继承的概念及定义 概念: 定义: 继承关系和访问限定符 总结 基类和派生类对象赋值转换 继承中的作用域 派生类的默认成员函数 继承与友元 继承与静态成员 复杂的菱形继承及菱形虚拟继承 虚继承原理 继承的总结 继承的概念及定义 概念: 继承机制是面向对象程序设计为了提高代码复用率的一种手段,它可以保持原类特性的基础上进行拓展,简单来说继承是类层次的复用. 接下来我们来看一个简单的继承 class Person { public: void Print() { cout<<"nam

  • Golang 内存模型详解(一)

    开始之前 首先,这是一篇菜B写的文章,可能会有理解错误的地方,发现错误请斧正,谢谢. 为了治疗我的懒癌早期,我一次就不写得太多了,这个系列想写很久了,每次都是开了个头就没有再写.这次争取把写完,弄成一个系列. 此 nil 不等彼 nil 先声明,这个标题有标题党的嫌疑. Go 的类型系统是比较奇葩的,nil 的含义跟其它语言有些差别,这里举个例子(可以直接进入 http://play.golang.org/p/ezFhXX0dnB 运行查看结果): 复制代码 代码如下: package main

  • 浅析Java内存模型与垃圾回收

    1.Java内存模型 Java虚拟机在执行程序时把它管理的内存分为若干数据区域,这些数据区域分布情况如下图所示: 程序计数器:一块较小内存区域,指向当前所执行的字节码.如果线程正在执行一个Java方法,这个计数器记录正在执行的虚拟机字节码指令的地址,如果执行的是Native方法,这个计算器值为空. Java虚拟机栈:线程私有的,其生命周期和线程一致,每个方法执行时都会创建一个栈帧用于存储局部变量表.操作数栈.动态链接.方法出口等信息. 本地方法栈:与虚拟机栈功能类似,只不过虚拟机栈为虚拟机执行J

  • Java内存模型之重排序的相关知识总结

    一.数据依赖性 如果两个操作访问同一个变量,而且这两个操作中有一个操作为写操作,此时这两个操作之间存在数据依赖性.数据依赖性分为三种,如表所示: 名称 代码示例 说明 写后读 a=1;b=a; 写一个变量后,再读这个位置 写后写 a=1;a=2; 写一个变量后,在写这个变量 读后写 a=b;b=1; 读一个变量后,再写这个变量 上面的这三种情况,只要重排序了两个操作的执行顺序,程序的执行结果就会被改变.编译器和处理器针对单个处理器中执行的指令序列和单个线程中执行的操作重排序时,会遵守数据依赖性,

随机推荐