struct的内存对齐学习笔记

文章目录

  • 1. 什么是内存对齐
  • 2. 为什么需要考虑内存对齐
  • 3. C语言结构体对齐规则:


1. 什么是内存对齐

内存对齐是指数据在内存中的存储起始地址是某个值的倍数,在C语言中,结构体是一种复合数据类型,其构成元素既可以是基本数据类型(如int、long、float等)的变量,也可以是一些复合数据类型(如数组、结构体、联合体等)的数据单元。在结构体中,编译器为结构体的每个成员按其自然边界(alignment)分配空间。各个成员按照它们被声明的顺序在内存中顺序存储,第一个成员的地址和整个结构体的地址相同。
为了使CPU能够对变量进行快速的访问,变量的起始地址应该具有某些特性,即所谓的“对齐",比如4字节的int型,其起始地址应该位于4字节的边界上,即起始地址能够被4整除,也即“对齐"跟数据在内存中的位置有关。如果一个变量的内存地址正好位于它长度的整数倍,他就被称做自然对齐。比如在32位cpu下,假设一个整型变量的地址为0x00000004(为4的倍数),那它就是自然对齐的,而如果其地址为0x00000002(非4的倍数)则是非对齐的。现代计算机中内存空间都是按照bvte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定类型变量的时候经常在特定的内存地址访问,这就需要各种类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐

2. 为什么需要考虑内存对齐

需要字节对齐的根本原因在于CPU访问数据的效率问题。假设上面整型变量的地址不是自然对齐,比如为0x00000002、则CPU如果取它的值的话需要访问两次内存,第一次取从0x00000002-0x00000003的一个short,第二次取从0x00000004-0x00000005的一个short然后组合得到所要的数据,如果变量在0x00000003地址上的话则要访问三次内存,第一次为char,第二次为short,第三次为char,然后组合得到整型数据
而如果变量在自然对齐位置上,则只要一次就可以取出数据。一些系统对对齐要求非常严格,比如sparc系统,如果取未对齐的数据会发生错误,而在x86上就不会出现错误,只是效率下降。
各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。比如有些平台每次读都是从偶地址开始,如果一个int型(假设为32位系统)如果存放在偶地址开始的地方,那么一个读周期就可以读出这32bit,而如果存放在奇地址开始的地方,就需要2个读周期,并对两次读出的结果的高低字节进行拼凑才能得到该32bit数据。显然在读取效率上下降很多。

  • 大多数计算机硬件要求基本数据类型的变量在内存中的地址是它们大小的倍数。例如,一个 32 位整数通常需要在内存中对齐到 4 字节边界。
  • 内存对齐可以提高访问内存的速度。当数据按照硬件要求的对齐方式存储时,CPU可以更高效地访问内存,减少因为不对齐而引起的性能损失。
  • 许多计算机体系结构使用缓存行(cache line)来从内存中加载数据到缓存中。如果数据是对齐的,那么一个缓存行可以装载更多的数据,提高缓存的命中率。
  • 有些计算机架构要求原子性操作(比如原子性读写)必须在特定的内存地址上执行。如果数据不对齐,可能导致无法执行原子性操作,进而引发竞态条件。

3. C语言结构体对齐规则:

结构体(struct)的数据成员,第一个数据成员存放的地址为结构体变量偏移量为0的地址处.

其他结构体成员自身对齐时,存放的地址为min{有效对齐值为自身对齐值, 指定对齐值} 的最小整数倍的地址处.
注:自身对齐值:结构体变量里每个成员的自身大小
注:指定对齐值:有宏 #pragma pack(N) 指定的值,这里面的 N一定是2的幂次方.如1,2,4,8,16等.如果没有通过宏那么在32位Linux主机上默认指定对齐值为4,64位的默认对齐值为8,AMR CPU默认指定对齐值为8;
注:有效对齐值:结构体成员自身对齐时有效对齐值为自身对齐值与指定对齐值中 较小的一个.

总体对齐时,字节大小是min{所有成员中自身对齐值最大的, 指定对齐值} 的整数倍.

#pragma pack(N) 每个特定平台上的编译器都有自己的默认“对齐系数”(也叫对齐模数)。程序员可以通过预编译命令#pragma pack(n),n=1,2,4,8,16来改变这一系数,其中的n就是你要指定的“对齐系数”。

结构体内存对齐的规则

  1. 第一个成员在结构体变量为0的地址处

  2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处
    对齐数=编译器默认的对齐数与该成员大小的较小值

  3. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍

  4. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍数,结构体的总大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍

(vs的默认对齐数为8,linux没有默认对齐数)

//此代码在64位Linux下编写
typedef struct _st_struct1
 {
	char 	a;
	short   b;
	int		c;
 }st_struct1;
 
 printf("%ld\n",sizeof(st_struct1));

打印结果为:8. 让我们分析一下为什么结果为8.
a是char类型,占1个字节.第一个数据成员,放在结构体变量偏移量为0 的地址处.
b是short类型,占2个字节,接下来我们要看结构体对齐规则,b的有效对齐值为min{2, 8}=2. 依次查看2的整数倍地址是否可以存放俩个字节.2×0=0 //此地址处已经存放a. 2×1=2 //此地址为空,我们将占有俩个字节的b存放在地址偏移量为2和3处.
c是int类型,占4个字节,我们根据结构体对齐规则可知,c的有效对齐值为4.对齐到4的整数倍地址,即地址偏移量为4处.在内存中存放的位置为4,5,6,7.
结构体总对齐字节大小为min{4, 8}=4 的整数倍.此时内存中共占8个字节,正好是4的整数倍,所以sizeof(st_struct1)=8.
占用内存空间如下:
struct的内存对齐学习笔记_第1张图片
另一个例子
struct的内存对齐学习笔记_第2张图片
由规则1 “第一个成员在结构体变量为0的地址处”,故c的位置在0地址处(橙色部分),又因为是char类型,只占第一个字节
由规则2,该成员变量为int类型,大小为4个字节,比vs默认对齐数8要小,故i对齐到对齐数4的整数倍即下标为4的位置(绿色部分),并向下占用4个字节
同理,d为double类型,大小与默认对齐数相同,故从i的结束位置向下找8的整数倍数,并占用8个字节
蓝色部分即为结构体内存对齐遵循规则浪费的空间
照应规则3: 由结果值为16,该结构体的最大对齐数为8,结构体总大小为16,为最大对齐数的整数倍

你可能感兴趣的:(cpp软件开发学习笔记,学习,笔记)