C++中的数据对齐示例详解

前言

对于C/C++程序员来说,掌握数据对齐是很有必要的,因为只有了解了这个概念,才能知道编译器在什么时候会偷偷的塞入一些字节(padding)到我们的结构体(struct/class),也唯有这样我们才能更好的理解、优化结构体和内存。

几个栗子

看看几个简单的Struct,能猜出他们的SIZE吗?(运行于64Bit win10 vs2017)

struct A
{
	char c1;
};

struct B
{
	int i1;
};

struct C
{
	char c1;
	int i1;
};

struct D
{
	char c1;
	int i1;
	char c2;
};

struct E
{
	char c1;
	char c2;
	int i1;
};

int main()
{
	std::cout << "A's size is " << sizeof(A) << std::endl;
	std::cout << "B's size is " << sizeof(B) << std::endl;
	std::cout << "C's size is " << sizeof(C) << std::endl;
	std::cout << "D's size is " << sizeof(D) << std::endl;
	std::cout << "E's size is " << sizeof(E) << std::endl;
}

先揭晓答案

如果对任何一个结构体的大小有疑问,那么这篇文章非常适合你,请接着往下看,我们会解释数据对齐。

数据对齐

处理器读取数据的行为

在C/C++中,每种数据类型都有对齐的要求(这个更多是处理器的要求而非语言层面),大家都知道,处理器工作的时候需要数据总线(data bus)、控制总线(control bus)和地址总线(address bus)一起配合工作。而在数据总线取数据的时候,处理器为了高效的工作,一次会取4byte或者8byte数据(依系统32bit或者64bit而不同),这就是所谓数据字长(word size)。同时在读取内存的时候,也会从4byte或者8byte边界开始读取,这是处理器行为,我们只能尊重不能改变。考虑下面的例子,

struct F
{
  int i1
  char c1;
  int i2;
  char c2;
};
#include <iostream>

int main()
{
  F f;
  printf("0x%p\n", &f);
}

它的起始地址输出是:

0x000000FE8BCFFB88

所以在内存中可能的排列就是:

读取数据的时候,每次读入8btye,8个字节为一个读取单元,就像蒸笼的一格,这样做的好处是每次可以尽可能多的读入数据,减少读取次数。设想,如果一次只读入一个字节数据,那么一个Int就需要4次读取,明显效率就很低。

编译器的做法

如果没有对齐

了解了处理器如何读取数据的,我们就不难理解编译器为什么会做出调整。试想,如果编译器不在后台做出填充(padding),那么我们就会遇到这种情况

像这样的话,访问i1, c1 都不会有问题,但是访问i2就会发现,数据散落在不同的蒸笼,原本只需要一次读取就行的数据,还需要一次额外的数据读取才行,这就造成了读取数据的低效,在某些严格的CPU,比如ARM上面,这种非对齐的数据读操作甚至会被拒绝。

编译器对齐

所以,为了让数据读取效率最大化,编译器会选择牺牲一部分空间来换取效率,他们不会允许i2横跨两个读取单元。在实际中,上面的结构体会是这样的

可以看出,

  • 为了解决i2的对齐问题,c1之后填充了3个空字节
  • 同时为了保持整个结构体的对齐(结构体对齐字节数等于其最大的数据成员的对齐字节数,这里是4),在结构体的尾部还会有3个空字节
  • 整个结构体的大小就是16字节,有6个字节是空字节。

所以,在编译器的作用下,最开始几个Struct实际上扩展为,

struct A
{
	char c1; //no padding
};

struct B
{
	int i1; //no padding
};

struct C
{
	char c1;
	char pad[3]; //padding
	int i1;
};

struct D
{
	char c1;
	char pad1[3]; //padding
	int i1;
	char c2;
	char pad2[3]; //padding
};

struct E
{
	char c1;
	char c2;
	char pad[2]; //padding
	int i1;
};

对齐的目的是要让数据访问更高效,一般来说,数据类型的对齐要求和它的长度是一致的,比如,

  • char 是 1
  • short 是 2
  • int 是 4
  • double 是 8

这不是巧合,比如short,2对齐保证了short只可能出现在一个读取单元的0, 2, 4, 6格,而不会出现在1, 3, 5, 7格;再比如int,4对齐保证了一个读取单元可以装载2个int——在0或者4格。从根本上杜绝了同一个数据横跨读取单元的问题。

总结

可能有人会疑惑了,知道这些对我们工作有什么帮助吗?如果仅仅是比较High-Level的应用程序编程,可能确实感觉不明显,最多就当成一个知识点了解一下,但是对于搞比较底层开发的,比如游戏引擎,或者是在内存环境很紧张的情况下开发,比如嵌入式开发,那了解这个有助于在某些情况下节约内存。

考虑前面的D和E结构体,他们拥有完全一样的成员,却有着不同的结构体大小,就是因为E选择把对齐要求接近的变量类型放在一起,减小了填充padding的数量从而达到了减小结构体大小的目的。

在设计结构体的时候,这个可以作为一个考量,有一些函数可以帮助我们查看某个类型的对齐要求,比如Visual Studio中的__alignof函数。

这就是关于数据对齐的一些基础知识,希望能帮助大家解惑,如果您发现本文有任何写的不对的地方,欢迎留言指出来;如果有其他问题,也欢迎留言一起讨论。

到此这篇关于C++中的数据对齐的文章就介绍到这了,更多相关C++数据对齐内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • C/C++数据对齐详细解析

    Data Alignment 关于数据对齐问题,现在多多少少有了一些接触,简单地说下自己的看法. 1.对齐的背景 大端和小端的问题有必要在这里介绍一下,计算机里面每个地址单元对应着一个字节,一个字节为8bit,对于位数大于8位的处理器来说,寄存器的宽度是大于一个字节的,例如16bit的short型变量x,在内存中的地址是0x0010,x的值为0x1122,0x11为高字节,0x22为低字节,常用的X86结构是小端模式,很多ARM,DSP都是小端模式,而KEIL C51则为大端模式.内存空间是按照

  • C++中的数据对齐示例详解

    前言 对于C/C++程序员来说,掌握数据对齐是很有必要的,因为只有了解了这个概念,才能知道编译器在什么时候会偷偷的塞入一些字节(padding)到我们的结构体(struct/class),也唯有这样我们才能更好的理解.优化结构体和内存. 几个栗子 看看几个简单的Struct,能猜出他们的SIZE吗?(运行于64Bit win10 vs2017) struct A { char c1; }; struct B { int i1; }; struct C { char c1; int i1; };

  • 详解Python中生成随机数据的示例详解

    目录 随机性有多随机 加密安全性 PRNG random 模块 数组 numpy.random 相关数据的生成 random模块与NumPy对照表 CSPRNG 尽可能随机 os.urandom() secrets 最佳保存方式 UUID 工程随机性的比较 在日常工作编程中存在着各种随机事件,同样在编程中生成随机数字的时候也是一样,随机有多随机呢?在涉及信息安全的情况下,它是最重要的问题之一.每当在 Python 中生成随机数据.字符串或数字时,最好至少大致了解这些数据是如何生成的. 用于在 P

  • C++中的内存对齐实例详解

    C++中的内存对齐实例详解 内存对齐 在我们的程序中,数据结构还有变量等等都需要占有内存,在很多系统中,它都要求内存分配的时候要对齐,这样做的好处就是可以提高访问内存的速度. 我们还是先来看一段简单的程序: 程序一 #include <iostream> using namespace std; struct X1 { int i;//4个字节 char c1;//1个字节 char c2;//1个字节 }; struct X2 { char c1;//1个字节 int i;//4个字节 ch

  • Mysql联表update数据的示例详解

    1.MySQL UPDATE JOIN语法 在MySQL中,可以在 UPDATE语句 中使用JOIN子句执行跨表更新.MySQL UPDATE JOIN的语法如下: UPDATE T1, T2, [INNER JOIN | LEFT JOIN] T1 ON T1.C1 = T2. C1 SET T1.C2 = T2.C2, T2.C3 = expr WHERE condition 更详细地看看MySQL UPDATE JOIN语法: 首先,在UPDATE子句之后,指定主表(T1)和希望主表连接表

  • Java中的反射机制示例详解

    目录 反射 什么是Class类 获取Class实例的三种方式 通过反射创建类对象 通过反射获取类属性.方法.构造器 更改访问权限和实例赋值 运用场景 反射 反射就是把Java类中的各个成分映射成一个个的Java对象.即在运行状态中,对于任意一个类,都能够知道这个类的所以属性和方法:对于任意一个对象,都能调用它的任意一个方法和属性.这种动态获取信息及动态调用对象方法的功能叫Java的反射机制 每一个Java程序执行必须通过编译.加载.链接和初始化四个阶段 1.编译:将.java.文件编译成字节码.

  • 利用MySqlBulkLoader实现批量插入数据的示例详解

    目录 介绍 1.将List转化为DataTable 2.将DataTable转换为标准的CSV文件 3.CSV文件导入数据到数据库 4.使用MySqlBulkLoader批量插入数据 5.完整的代码 介绍 最近在项目中遇到插入数据瓶颈,几万.几十万.几百万的数据保存到MYSQL数据库,使用EF插入数据速度非常慢,数据量非常大时EF插入需要几十分钟,甚至几个小时,这样子的速度肯定不是我们所期望的. 后面经过了解与研究发现MySqlBulkLoader,可以批量将数据插入到数据库并且速度上面远远优于

  • Swift 中的 JSON 反序列化示例详解

    目录 业界常用的几种方案 手动解码方案,如 Unbox(DEPRECATED) 阿里开源的 HandyJSON 基于 Sourcery 的元编程方案 Swift build-in API Codable 属性装饰器,如 BetterCodable 各个方案优缺点对比 Codable 介绍 原理浅析 Decoder.Container 协议 自研方案 功能设计 Decoder.Container 具体实现 再议 PropertyWrapper 应用场景示例 单元测试 性能对比 业界常用的几种方案

  • Go语言中的数据竞争模式详解

    目录 前言 Go在goroutine中通过引用来透明地捕获自由变量 切片会产生难以诊断的数据竞争 并发访问Go内置的.不安全的线程映射会导致频繁的数据竞争 Go开发人员常在pass-by-value时犯错并导致non-trivial的数据竞争 消息传递(通道)和共享内存的混合使用使代码变得复杂且易受数据竞争的影响 Add和Done方法的错误放置会导致数据竞争 并发运行测试会导致产品或测试代码中的数据竞争 小结 前言 本文主要基于在Uber的Go monorepo中发现的各种数据竞争模式,分析了其

  • Pandas读存JSON数据操作示例详解

    目录 引言 读取json数据 模拟数据 参数orident orident="split" orient="records" orient="index" orient="columns" orient="values" to_json 引言 本文介绍的如何使用Pandas来读取各种json格式的数据,以及对json数据的保存 读取json数据 使用的是pd.read_json函数,见官网:pandas.p

  • python案例中Flask全局配置示例详解

    目录 WEB服务全局配置 Flask全局配置 before_request after_request Flask自定义中间件 WEB服务全局配置 在目前的开发过市场当中,有很多WEB服务框架,Flask只是其中之一,但是总体上来看,所有的WEB框架都是依据HTTP协议的逻辑从请求到响应设计的.固然有很多功能是独立的,但是也有一部分功能需要全局设定,比如安全校验,比如埋点日志,那么这里就用到了全局配置. 所谓的全局配置,就是在框架全局,请求前后,响应前后,设置的全局配置,比如登录校验,这个功能并

随机推荐