浅谈C++ 虚函数分析

虚函数调用属于运行时多态,在类的继承关系中,通过父类指针来调用不同子类对象的同名方法,而产生不同的效果。

C++ 中的多态是通过晚绑定(对象构造时)来实现的。

用法

在函数之前声明关键字 virtual 表示这是一个虚函数,在函数后增加一个 = 0 表示这是一个纯虚函数,纯虚函数的类不能创建具体实例。

该示例作后文分析使用,一个包含纯虚函数的父类,一个重写了父类方法的子类,一个无继承的类。

struct Base {
  Base() : val(7777) {}
  virtual int fuck(int a) = 0;
  int val;
};

struct Der : public Base {
  Der() = default;
  int fuck(int a) override { return val + 4396; }
};

struct A {
  A() = default;
  void funny(int a) {}
};

int main() {
  Der der;
  Base *pbase = &der;
  pbase->fuck(sizeof(Der)); // 调用 Der::fuck(int a);

  A a;
  a.funny(sizeof(A)); // A::funny(int a);

  return 3;
}

实现

原来就了解虚函数是通过虚表的偏移来获取实际调用函数地址来实现的,但是在何时确定这个偏移和具体的偏移细节也没有说明,今儿个来探探究竟。

拿上面的代码进行反汇编获提取部分函数,main,Base::Base(), Base::fuck(), Der::Der(), Der::fuck, A::funny() 如下:

_ZN4BaseC2Ev:
.LFB1:
  .cfi_startproc
  pushq  %rbp
  .cfi_def_cfa_offset 16
  .cfi_offset 6, -16
  movq  %rsp, %rbp
  .cfi_def_cfa_register 6
  movq  %rdi, -8(%rbp)  // 还是 main 函数的栈帧 -32(%rpb) 的地址
  leaq  16+_ZTV4Base(%rip), %rdx // 关键点来了,取虚表偏移 16 的地址也就是 __cxa_pure_virtual,这里是没有意义的
  movq  -8(%rbp), %rax
  movq  %rdx, (%rax)   // 将 __cxa_pure_virtual 的地址存放在 地址rax 的内存中(这个例子中也就是main 函数的栈帧 -32(%rpb) 的地方),
  movq  -8(%rbp), %rax  // 然后往后偏移 8 个字节,也就是跳过虚表指针,对成员变量 val 初始化。
  movl  $7777, 8(%rax)
  nop           // 注:上面是用这个示例中实际的地址带入的,实际上对于一个有的类的处理是一个通用逻辑的,构造函数传入的第一个参数 rdi 是 this 指针,由于有虚表存在的影响,这里会修改 this 指针所在地址的内容,也就是虚表的偏移地址(非起始地址)
  popq  %rbp
  .cfi_def_cfa 7, 8
  ret
  .cfi_endproc
.LFE1:
  .size  _ZN4BaseC2Ev, .-_ZN4BaseC2Ev
  .weak  _ZN4BaseC1Ev
  .set  _ZN4BaseC1Ev,_ZN4BaseC2Ev
  .section  .text._ZN3Der4fuckEi,"axG",@progbits,_ZN3Der4fuckEi,comdat
  .align 2
  .weak  _ZN3Der4fuckEi
  .type  _ZN3Der4fuckEi, @function
_ZN3Der4fuckEi:
.LFB3:
  .cfi_startproc
  pushq  %rbp
  .cfi_def_cfa_offset 16
  .cfi_offset 6, -16
  movq  %rsp, %rbp
  .cfi_def_cfa_register 6
  movq  %rdi, -8(%rbp)
  movl  %esi, -12(%rbp)
  movq  -8(%rbp), %rax
  movl  8(%rax), %eax  // 成员变量 val,val 是从 rdi 中偏移 8 字节取的值
  addl  $4396, %eax   // val + 4396
  popq  %rbp
  .cfi_def_cfa 7, 8
  ret
  .cfi_endproc
.LFE3:
  .size  _ZN3Der4fuckEi, .-_ZN3Der4fuckEi
  .section  .text._ZN1A5funnyEi,"axG",@progbits,_ZN1A5funnyEi,comdat
  .align 2
  .weak  _ZN1A5funnyEi
  .type  _ZN1A5funnyEi, @function
_ZN1A5funnyEi:
.LFB4:
  .cfi_startproc
  pushq  %rbp
  .cfi_def_cfa_offset 16
  .cfi_offset 6, -16
  movq  %rsp, %rbp
  .cfi_def_cfa_register 6
  movq  %rdi, -8(%rbp)
  movl  %esi, -12(%rbp)
  nop
  popq  %rbp
  .cfi_def_cfa 7, 8
  ret
  .cfi_endproc
.LFE4:
  .size  _ZN1A5funnyEi, .-_ZN1A5funnyEi
  .section  .text._ZN3DerC2Ev,"axG",@progbits,_ZN3DerC5Ev,comdat
  .align 2
  .weak  _ZN3DerC2Ev
  .type  _ZN3DerC2Ev, @function
_ZN3DerC2Ev:
.LFB7:
  .cfi_startproc
  pushq  %rbp
  .cfi_def_cfa_offset 16
  .cfi_offset 6, -16
  movq  %rsp, %rbp
  .cfi_def_cfa_register 6
  subq  $16, %rsp
  movq  %rdi, -8(%rbp)  // rdi 是取的 main 栈帧 -32(%rbp) 的地址
  movq  -8(%rbp), %rax
  movq  %rax, %rdi
  call  _ZN4BaseC2Ev   // Base 的构造函数,并且又把传进来的参数作为实参传进去了,这里跟踪进去
  leaq  16+_ZTV3Der(%rip), %rdx // 取虚表偏移16字节 _ZN3Der4fuckEi 的地址
  movq  -8(%rbp), %rax
  movq  %rdx, (%rax)   // rax 在之前的 Base构造函数中是被修改了的,这里将继续修改内容,前一次的修改失效。
  nop
  leave
  .cfi_def_cfa 7, 8
  ret
  .cfi_endproc
.LFE7:
  .size  _ZN3DerC2Ev, .-_ZN3DerC2Ev
  .weak  _ZN3DerC1Ev
  .set  _ZN3DerC1Ev,_ZN3DerC2Ev
  .text
  .globl main
  .type  main, @function
main:
.LFB5:
  .cfi_startproc
  pushq  %rbp
  .cfi_def_cfa_offset 16
  .cfi_offset 6, -16
  movq  %rsp, %rbp
  .cfi_def_cfa_register 6
  subq  $48, %rsp
  leaq  -32(%rbp), %rax // 取 -32(%rbp) 的地址,对应 Base *pbase;
  movq  %rax, %rdi
  call  _ZN3DerC1Ev   // 调用了构造函数,并且以-32(%rbp) 的地址作为参数,这里跟踪进去
  leaq  -32(%rbp), %rax // -32(%rbp) 被修改,该内存中的内容为 Der 虚表的偏移地址
  movq  %rax, -8(%rbp)
  movq  -8(%rbp), %rax
  movq  (%rax), %rax  // rax = M[rax],取出虚表偏移中的地址
  movq  (%rax), %rdx  // rdx = M[rax] , 取出虚表偏移的内容(也就是函数地址),算上上面这是做了两次解引用
  movq  -8(%rbp), %rax
  movl  $16, %esi    // sizeof(Der) = 16, 包含一个虚表指针和 int val;
  movq  %rax, %rdi   // 虚表偏移中的地址
  call  *%rdx      // 调用函数
  leaq  -33(%rbp), %rax
  movl  $1, %esi
  movq  %rax, %rdi
  call  _ZN1A5funnyEi  // 普通成员函数,实现简单
  movl  $3, %eax
  leave
  .cfi_def_cfa 7, 8
  ret
  .cfi_endproc
.LFE5:
  .size  main, .-main
  .weak  _ZTV3Der
  .section  .data.rel.ro.local._ZTV3Der,"awG",@progbits,_ZTV3Der,comdat
  .align 8
  .type  _ZTV3Der, @object
  .size  _ZTV3Der, 24
_ZTV3Der:
  .quad  0
  .quad  _ZTI3Der
  .quad  _ZN3Der4fuckEi // Der::fuck(int a);
  .weak  _ZTV4Base
  .section  .data.rel.ro._ZTV4Base,"awG",@progbits,_ZTV4Base,comdat
  .align 8
  .type  _ZTV4Base, @object
  .size  _ZTV4Base, 24
_ZTV4Base:
  .quad  0
  .quad  _ZTI4Base
  .quad  __cxa_pure_virtual // 纯虚函数,无对应符号表
  .weak  _ZTI3Der
  .section  .data.rel.ro._ZTI3Der,"awG",@progbits,_ZTI3Der,comdat
  .align 8
  .type  _ZTI3Der, @object
  .size  _ZTI3Der, 24

现在是一个纯虚函数,类中也没有虚析构函数,通过反汇编来看一些这个实现。

_ZTV3Der_ZTV4Base 是两个虚表,大小为 24, 8 字节对齐,分别对应 Der 子类和 Base 父类。虚表中偏移 16 字节(偏移大小可能和实现相关)为虚函数地址,每次构造函数的被调用的时候,会将该偏移地址存储到父类指针所在内存中,所以在上代码中看到,在 Base 和 Der 类的构函数中都出现了设置偏移地址的操作,但是子类构造函数会覆盖父类的修改。这样一来,实际的函数运行地址依赖构造函数,子类对象被构造就调用子类的方法,父类构造就调用父类的方法(非纯虚函数),实现了运行时多态。

增加一个虚函数后, 后面的虚函数地址就添加到虚表之中,如下

virtual void Base::shit() {}
void Der::shit() override {}

_ZTV3Der:
  .quad  0
  .quad  _ZTI3Der
  .quad  _ZN3Der4fuckEi
  .quad  _ZN3Der4shitEv
  .weak  _ZTV4Base
  .section  .data.rel.ro._ZTV4Base,"awG",@progbits,_ZTV4Base,comdat
  .align 8
  .type  _ZTV4Base, @object
  .size  _ZTV4Base, 32
_ZTV4Base:
  .quad  0
  .quad  _ZTI4Base
  .quad  __cxa_pure_virtual
  .quad  _ZN4Base4shitEv
  .weak  _ZTI3Der
  .section  .data.rel.ro._ZTI3Der,"awG",@progbits,_ZTI3Der,comdat
  .align 8
  .type  _ZTI3Der, @object
  .size  _ZTI3Der, 24

再调用另外一个虚函数就简单很多了,直接地址进行偏移(这里shit在fuck之后,所以+8)

 movq  -8(%rbp), %rax
  movq  (%rax), %rax
  addq  $8, %rax
  movq  (%rax), %rdx
  movq  -8(%rbp), %rax
  movq  %rax, %rdi
  call  *%rdx

简单画了一下虚函数运行的内存结构图

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。

(0)

相关推荐

  • 浅谈C++基类的析构函数为虚函数

    1.原因: 在实现多态时, 当用基类指针操作派生类, 在析构时候防止只析构基类而不析构派生类. 2.例子: (1). #include<iostream> using namespace std; class Base{ public: Base() {}; ~Base() {cout << "Output from the destructor of class Base!" << endl;}; void DoSomething() { cout

  • 详解C++编程中的虚函数

    我们知道,在同一类中是不能定义两个名字相同.参数个数和类型都相同的函数的,否则就是"重复定义".但是在类的继承层次结构中,在不同的层次中可以出现名字相同.参数个数和类型都相同而功能不同的函数. 人们提出这样的设想,能否用同一个调用形式,既能调用派生类又能调用基类的同名函数.在程序中不是通过不同的对象名去调用不同派生层次中的同名函数,而是通过指针调用它们.例如,用同一个语句"pt->display( );"可以调用不同派生层次中的display函数,只需在调用前

  • C++ 中const修饰虚函数实例详解

    C++ 中const修饰虚函数实例详解 [1]程序1 #include <iostream> using namespace std; class Base { public: virtual void print() const = 0; }; class Test : public Base { public: void print(); }; void Test::print() { cout << "Test::print()" << end

  • C++虚函数及虚函数表简析

    C++中的虚函数的作用主要是实现了多态的机制.关于多态,简而言之就是用父类型别的指针指向其子类的实例,然后通过父类的指针调用实际子类的成员函数.这种技术可以让父类的指针有"多种形态",这是一种泛型技术.所谓泛型技术,说白了就是试图使用不变的代码来实现可变的算法.比如:模板技术,RTTI技术,虚函数技术,要么是试图做到在编译时决议,要么试图做到运行时决议. 关于虚函数的使用方法,我在这里不做过多的阐述.大家可以看看相关的C++的书籍.在这篇文章中,我只想从虚函数的实现机制上面为大家 一个

  • C++ 虚函数的详解及简单实例

    C++ 虚函数的详解 虚函数的使用和纯虚函数的使用. 虚函数是在基类定义,然后子类重写这个函数后,基类的指针指向子类的对象,可以调用这个函数,这个函数同时保留这子类重写的功能. 纯虚函数是可以不用在基类定义,只需要声明就可以了,然后因为是纯虚函数,是不能产生基类的对象,但是可以产生基类的指针. 纯虚函数和虚函数最主要的区别在于,纯虚函数所在的基类是不能产生对象的,而虚函数的基类是可以产生对象的. // pointers to base class #include <iostream> usi

  • C++虚函数的实现机制分析

    本文针对C++的虚函数的实现机制进行较为深入的分析,具体如下: 1.简单地说,虚函数是通过虚函数表实现的.那么,什么是虚函数表呢? 事实上,如果一个类中含有虚函数,则系统会为这个类分配一个指针成员指向一张虚函数表(vtbl),表中每一项指向一个虚函数的地址,实现上就是一个函数指针的数组. 例如下面这个例子: class Parent { public: virtual void foo1() { } virtual void foo1() { } void foo1(); }; class Ch

  • C++中虚函数与纯虚函数的用法

    本文较为深入的分析了C++中虚函数与纯虚函数的用法,对于学习和掌握面向对象程序设计来说是至关重要的.具体内容如下: 首先,面向对象程序设计(object-oriented programming)的核心思想是数据抽象.继承.动态绑定.通过数据抽象,可以使类的接口与实现分离,使用继承,可以更容易地定义与其他类相似但不完全相同的新类,使用动态绑定,可以在一定程度上忽略相似类的区别,而以统一的方式使用它们的对象. 虚函数的作用是实现多态性(Polymorphism),多态性是将接口与实现进行分离,采用

  • 虚函数与纯虚函数(C++与Java虚函数的区别)的深入分析

    c++虚函数1.定义:在某基类中声明为 virtual 并在一个或多个派生类中被重新定 义的成员函数 [1]2.语法:virtual 函数返回类型 函数名(参数表) { 函数体 }3.用途:实现多态性,通过指向派生类的基类指针,访问派生类中同名覆盖成员函数,也就是允许子类override父类同名方法.虚函数的作用是实现动态联编,也就是在程序的运行阶段动态地选择合适的成员函数,在定义了虚函数后,可以在基类的派生类中对虚函数重新定义,在派生类中重新定义的函数应与虚函数具有相同的形参个数和形参类型(也

  • 浅谈C++中虚函数实现原理揭秘

    编译器到底做了什么实现的虚函数的晚绑定呢?我们来探个究竟. 编译器对每个包含虚函数的类创建一个表(称为V TA B L E).在V TA B L E中,编译器放置特定类的虚函数地址.在每个带有虚函数的类 中,编译器秘密地置一指针,称为v p o i n t e r(缩写为V P T R),指向这个对象的V TA B L E.通过基类指针做虚函数调 用时(也就是做多态调用时),编译器静态地插入取得这个V P T R,并在V TA B L E表中查找函数地址的代码,这样就能调用正确的函数使晚捆绑发生

  • 深入解析C++中的虚函数与多态

    1.C++中的虚函数C++中的虚函数的作用主要是实现了多态的机制.关于多态,简而言之就是用父类型别的指针指向其子类的实例,然后通过父类的指针调用实际子类的成员函数.这种技术可以让父类的指针有"多种形态",这是一种泛型技术.所谓泛型技术,说白了就是试图使用不变的代码来实现可变的算法.比如:模板技术,RTTI技术,虚函数技术,要么是试图做到在编译时决议,要么试图做到运行时决议. 对C++ 了解的人都应该知道虚函数(Virtual Function)是通过一张虚函数表(Virtual Tab

  • c++ 虚函数与纯虚函数的区别(深入分析)

    在面向对象的C++语言中,虚函数(virtual function)是一个非常重要的概念.因为它充分体现 了面向对象思想中的继承和多态性这两大特性,在C++语言里应用极广.比如在微软的MFC类库中,你会发现很多函数都有virtual关键字,也就是说, 它们都是虚函数.难怪有人甚至称虚函数是C++语言的精髓. 那么,什么是虚函数呢,我们先来看看微软的解释: 虚函数是指一个类中你希望重载的成员函数,当你用一个基类指针或引用指向一个继承类对象的时候,你调用一个虚函数,实际调用的是继承类的版本. 这个定

  • 浅析C++中的虚函数

    一.定义定义:在某基类中声明为 virtual 并在一个或多个派生类中被重新定义的成员函数. 语法:virtual 函数返回类型函数名(参数表) { 函数体 } 用途:实现多态性,通过指向派生类的基类指针,访问派生类中同名覆盖成员函数 虚函数必须是基类的非静态成员函数,其访问权限可以是protected或public. 定义为virtual的函数是基类期待派生类重新定义的,基类希望派生类继承的函数不能定义为虚函数. 二.作用虚函数的作用是实现动态联编,也就是在程序的运行阶段动态地选择合适的成员函

随机推荐