1、前言

什么是字节对齐呢?现代计算机中的内存空间都是按字节(byte)划分的,从理论上讲似乎任何类型的变量的访问都可以从任何地址开始,但是实际情况是在访问特定变量的时候经常需要在特定的内存地址进行访问,因此,就需要各种类型数据按照一定的规则在空间上排列,而不是顺序地一个接一个地排放,这就是字节对齐。

2、字节对齐的好处

各个硬件平台对存储空间的处理上有很大的不同,一些平台对某些特定类型的数据只能从某些特定的地址开始存取,比如有些架构的CPU在访问一个没有进行对齐的变量的时候会发生错误,那么在这种架构上编程必须保证字节对齐。其它平台可能没有这种情况,但是最常见的是如果不按照适合其平台要求对数据存放进行对齐,会在存取效率上带来损失,例如某些平台每次读都是从偶地址开始,如果一个int类型(32位系统)变量存放在偶地址开始的地方,那么一个读周期就可以读出32bit,而如果存放在奇地址开始的地方,就需要2个读周期,并对两次读出的结果进行高低字节的拼凑才能得到该32bit数据。

3、对齐的准则

有四个重要的基本概念,如下:

(1)数据类型自身的对齐值:char类型数据自身对齐值为1字节,short类型数据为2字节,int/float类型数据为4字节,double类型数据为8字节;

(2)结构体或类的自身对齐值:其成员中自身对齐值最大的哪个值;

(3)指定对齐值:#pragma pack(value)时指定对齐值value;

(4)数据成员、结构体和类的有效对齐值:自身对齐值和指定对齐值中的较小者,即:

有效对齐值=min{自身对齐值,当前指定的pack值}。

其中,有效对齐值N是最终用来决定数据存放地址方式的值,有效对齐N表示“对齐在N上”,也就是该数据的“存放起始地址%N=0”。

其实字节对齐的细节和具体编译器实现密切相关,但是一般而言,满足下面三个准则:

(1)结构体变量的首地址能够被其最宽基本类型成员的大小所整除;

(2)结构体每个成员相对于结构体首地址的偏移量都是成员大小的整数倍,如需要时,编译器会在成员之间加上填充字节;

(3)结构体的总大小为结构体最宽基本类型成员大小的整数倍,如需要时,编译器会在最末一个成员之后加上填充字节。

对于上面的三条对齐准则说明如下:

第一条:编译器在给结构体开辟空间时,首先找到结构体中最宽的基本数据类型,然后寻找内存地址能被这基本类型所整除的位置,并把这个地址作为结构体的首地址;

第二条:为结构体的一个成员开辟空间之间,编译器首先检查预开辟空间的地址相对于结构体首地址的偏移是否是本成员大小的整数倍,若是,则存放本成员,否则,在本成员和上一个成员之间填充一定的字节,以达到整数倍的要求;

第三条:结构体的总大小是包括填充的字节的,结构体的最后一个成员满足上面两个对齐准则以外,还必须满足第三条准则,否则就必须在最后填充几个字节以满足最后一条准则。

4、结构体字节对齐示例

接下来给出一个结构体字节对齐的简单示例,并对其进行分析:

示例的代码如下所示:

#include <stdio.h>
#include <stddef.h>
#include <stdlib.h> struct s {
char a;
short b;
char c;
int d;
char e[];
}; int main(int argc, char *argv[])
{
printf("sizeof(struct s):%zd\n", sizeof(struct s));
printf("offsets->a:%zd; b:%zd; c:%zd; d:%zd; e[0]:%zd; e[1]:%zd; e[2]:%zd\n",
offsetof(struct s, a), offsetof(struct s, b),
offsetof(struct s, c), offsetof(struct s, d),
offsetof(struct s, e[]), offsetof(struct s, e[]),
offsetof(struct s, e[])); exit(EXIT_SUCCESS);
}

使用gcc编译器进行编译,并运行,结果输出如下:

在测试代码中使用了offsetof这个宏,该宏能获取结构体中成员的偏移量,在运行结果中,我们可以看到,使用sizeof计算结构体的总大小为16字节,如果直接计算的话,char类型占1个字节,short类型占2个字节,int类型占4个字节,应该结构体大小为11个字节,为什么最终的大小是16字节呢?是由于用到了上面介绍的字节对齐的准则,下面对其进行分析:

首先,变量a为char类型占用1个字节,变量b为short类型,占用2个字节,根据准则2,需要在成员b和a之间填充1个字节,变量c为char类型,占用1个字节,变量d为int类型,占用4个字节,根据准则2,需要在成员d和c之间填充3个字节,数组e为char类型,占用3个字节,但是根据准则3,需要在最后填充1个字节,因此,结构体的总大小应为16字节。

5、更改对齐方式

在缺省情况下,C编译器为每一个变量或是数据单元按其自然对齐条件分配空间,一般地,可以通过下面的方法来改变缺省的对齐条件:

(1)使用伪指令#pragma pack(n):C编译器将按照n个字节进行对齐;

(2)使用伪指令#pragma pack():取消自定义的字节对齐方式;

另外,还有GCC的特有语法

(3)__attribute__((aligned(n))):让所作用的结构体成员对齐在n字节自然边界上,如果结构体中有成员的长度大于n,则按照最大成员的长度来对齐;

(4)__attribute__((packed)):取消结构体在编译过程中的优化对齐,按照实际占用的字节数进行对齐。

下面就更改对齐方式进行一些例子讲解:

使用#pragma pack()将结构体对齐方式进行更改,代码如下:

#include <stdio.h>
#include <stddef.h>
#include <stdlib.h> #pragma pack(1)
struct s {
char a;
short b;
char c;
int d;
char e[];
};
#pragma pack() int main(int argc, char *argv[])
{
printf("sizeof(struct s):%zd\n", sizeof(struct s));
printf("offsets->a:%zd; b:%zd; c:%zd; d:%zd; e[0]:%zd; e[1]:%zd; e[2]:%zd\n",
offsetof(struct s, a), offsetof(struct s, b),
offsetof(struct s, c), offsetof(struct s, d),
offsetof(struct s, e[]), offsetof(struct s, e[]),
offsetof(struct s, e[])); exit(EXIT_SUCCESS);
}

使用gcc对代码进行编译后运行,结果如下:

使用#pragma pack(1)将字节对齐方式设置为1字节,相当于取消了默认的字节对齐方式,因此编译器将不再对变量之间进行字节填充,所以,使用sizeof()得到就是数据类型占用的实际大小,为11个字节。

当使用#pragma pack(2)将字节对齐方式设置为2字节时,结果又如何呢?

#include <stdio.h>
#include <stddef.h>
#include <stdlib.h> #pragma pack(2)
struct s {
char a;
short b;
char c;
int d;
char e[];
};
#pragma pack() int main(int argc, char *argv[])
{
printf("sizeof(struct s):%zd\n", sizeof(struct s));
printf("offsets->a:%zd; b:%zd; c:%zd; d:%zd; e[0]:%zd; e[1]:%zd; e[2]:%zd\n",
offsetof(struct s, a), offsetof(struct s, b),
offsetof(struct s, c), offsetof(struct s, d),
offsetof(struct s, e[]), offsetof(struct s, e[]),
offsetof(struct s, e[])); exit(EXIT_SUCCESS);
}

使用gcc编译后,然后运行,结果如下: 

可以看到,结构体的总大小变成了14字节,分析如下:

变量a自身对齐值为1,指定对齐值为2,所以有效对齐值为1,假设结构体从0地址开始存储,符合0%1=0,变量b自身对齐值为2,指定对齐值为2,所以有效对齐值为2,从地址2开始存放,符合2%2=0,变量b和a之间需要填充1个字节,变量c自身对齐值为1,指定对齐值为2,有效对齐值为2,从地址4开始存储,符合4%2=0,变量d为int类型,自身对齐值为4,指定对齐值为2,有效对齐值为2,因此变量d和c之间填充1个字节,符合6%2=0,数组e依次类推,到最后一个成员时,由于指定对齐值为2字节,需要在最后填充1个字节,因此结构体的总大小为14字节。

当使用#pragma pack(8)将结构体指定对齐值为8时会怎么样呢?代码如下:

#include <stdio.h>
#include <stddef.h>
#include <stdlib.h> #pragma pack(8)
struct s {
char a;
short b;
char c;
int d;
char e[];
};
#pragma pack() int main(int argc, char *argv[])
{
printf("sizeof(struct s):%zd\n", sizeof(struct s));
printf("offsets->a:%zd; b:%zd; c:%zd; d:%zd; e[0]:%zd; e[1]:%zd; e[2]:%zd\n",
offsetof(struct s, a), offsetof(struct s, b),
offsetof(struct s, c), offsetof(struct s, d),
offsetof(struct s, e[]), offsetof(struct s, e[]),
offsetof(struct s, e[])); exit(EXIT_SUCCESS);
}

使用gcc编译,并运行,结果如下:

可以看到结构体的总大小为16字节,而且并不是按照8字节进行对齐,而是按照4字节进行对齐,因为下面这个对齐准则:

有效对齐值=min{自身对齐值,当前指定的pack值}

所以,上面的结构体将按照4字节进行对齐。

6、小节

本文主要简单介绍了C语言中结构体的字节对齐,对其基本的对齐准则以及一些具体例子进行了描述。

参考:

http://www.baike.com/wiki/%E5%AD%97%E8%8A%82%E5%AF%B9%E9%BD%90

https://www.jianshu.com/p/f69652c7df99

https://www.cnblogs.com/clover-toeic/p/3853132.html

C语言字节对齐分析的更多相关文章

  1. [转]C语言字节对齐问题详解

    C语言字节对齐问题详解 转载:https://www.cnblogs.com/clover-toeic/p/3853132.html 引言 考虑下面的结构体定义: typedef struct{ ch ...

  2. C语言字节对齐问题详解

    引言 考虑下面的结构体定义: typedef struct{ char c1; short s; char c2; int i; }T_FOO; 假设这个结构体的成员在内存中是紧凑排列的,且c1的起始 ...

  3. C语言字节对齐问题详解(对齐、字节序、网络序等)

    首先说明一下,本文是转载自: http://www.cnblogs.com/clover-toeic/p/3853132.html 博客园用的少,不知道怎么发布转载文章,只能暂时这样了. 引言 考虑下 ...

  4. C语言字节对齐问题详解【转】

    引言 转自:http://www.cnblogs.com/clover-toeic/p/3853132.html 考虑下面的结构体定义: 1 typedef struct{ 2 char c1; 3 ...

  5. C ~ C语言字节对齐

    1. 什么是对齐? 现代计算机中内存空间都是按照字节(byte)划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定变量的时候经常在特定的内存地址访问,这就需要各类型 ...

  6. C语言字节对齐

    转自:http://blog.csdn.net/21aspnet/article/details/6729724 文章最后本人做了一幅图,一看就明白了,这个问题网上讲的不少,但是都没有把问题说透. 一 ...

  7. C语言字节对齐 __align(),__attribute((aligned (n))),#pragma pack(n)

    转载地址 : http://blog.csdn.net/21aspnet/article/details/6729724 一.概念    对齐跟数据在内存中的位置有关.如果一个变量的内存地址正好位于它 ...

  8. C语言字节对齐 __align(),__attribute((aligned (n))),#pragma pack(n)【转】

    转自:https://www.cnblogs.com/ransn/p/5081198.html 转载地址 : http://blog.csdn.net/21aspnet/article/details ...

  9. C++中的字节对齐分析

    struct A { int a; char b; short c; }; struct B { char a; int b; short c; }; #pragma pack(2) struct C ...

随机推荐

  1. 24个Jvm面试题总结及答案

    1.什么是Java虚拟机?为什么Java被称作是“平台无关的编程语言”? Java虚拟机是一个可以执行Java字节码的虚拟机进程.Java源文件被编译成能被Java虚拟机执行的字节码文件. Java被 ...

  2. python跳出多循环

    参考https://www.php.cn/python-tutorials-88895.html 备注 Python的循环体自己就有else分支! 如果for循环没有执行break,则执行else,f ...

  3. $.fn.extend 与 $.extend的区别

    今天看到别人写的jquery 代码都是这样的 $.fn.extend 所以查询了一下,因为自己不是前端开发,看到这样写的,感觉很牛逼.从百度上搜到的感觉解释的还是挺好的,作为记录,方便以后查找. 搜索 ...

  4. javascript getElementsByClassName扩展函数

    代码: function getElementsByClassName(){ if(!arguments[0]){return []};//未指定任何参数,直接返回 var args=argument ...

  5. SQLMAP源码阅读(一)

  6. python打印带颜色字体

    设置颜色开始 :\033[显示方式;前景色;背景色m 前景色 背景色 颜色 30 40 黑色 31 41 红色 32 42 绿色 33 43 黃色 34 44 蓝色 35 45 紫红色 36 46 青 ...

  7. 为DS5添加新的gcc工具链

    环境: 步骤: 1.下载mingw32版本的工具链 下面有两个下载工具链的网站: ARM官网的: https://developer.arm.com/tools-and-software/open-s ...

  8. Nginx 核心配置-检测文件是否存在

    Nginx 核心配置-检测文件是否存在 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. try_files会按顺序检查文件是否存在,返回第一个找到的文件或文件夹(结尾加斜线表示为文件 ...

  9. hdu1677 贪心

    题意: 对于给出的n个俄罗斯套娃,要求将这n个套起来(满足w1 < w2 && h1 < h2才能套进去),最后输出最少剩下的套娃个数(尽可能去套起来) 题目分析: 朴素的 ...

  10. 目标检测论文解读11——Mask R-CNN

    目的 让Faster R-CNN能做实例分割的任务. 方法 模型的结构图如下. 与Faster R-CNN相比,主要有两点变化. (1) 用RoI Align替代RoI Pool. 首先回顾一下RoI ...