C语言字节对齐详解

C语言字节对齐详解C 语言字节对齐 12345 不同系统下的 C 语言类型长度 DataTypeILP3

C语言字节对齐12345

不同系统下的C语言类型长度

Data Type ILP32 ILP64 LP64 LLP64
char 8 8 8 8
short 16 16 16 16
int 32 64 32 32
long 32 64 64 32
long long 64 64 64 64
pointer 32 64 64 64

绝大部分64位的Unix,linux都是使用的LP64模型;32位Linux系统是ILP32模型;64位的Windows使用的是LLP64(long long and point 64)模型。

基本概念

许多计算机系统对基本数据类型合法地址做出了一些限制,要求某种类型对象的地址必须是某个值K(通常是2,4或8)的倍数。这种对齐限制简化了形成处理器和存储器系统之间的接口的硬件设计。对齐跟数据在内存中的位置有关。如果一个变量的内存地址正好位于它长度的整数倍,他就被称做自然对齐。比如在32位cpu下,假设一个整型变量的地址为0x00000004,那它就是自然对齐的。

为什么要字节对齐

需要字节对齐的根本原因在于CPU访问数据的效率问题。例如,假设一个处理器总是从存储器中取出8个字节,则地址必须为8的倍数。如果我们能保证将所有的double类型数据的地址对齐成8的倍数,那么就可以用一个存储器操作来读或者写值了。否则,我们可能需要执行两次存储器访问,因为对象可能被分放在两个8字节存储块中。

另外,假设一个整型变量的地址不是自然对齐,比如为0x00000002,则CPU如果取它的值的话需要访问两次内存,第一次取从0x00000002-0x00000003的一个short,第二次取从0x00000004-0x00000005的一个short然后组合得到所要的数据;如果变量在0x00000003地址上的话则要访问三次内存,第一次为char,第二次为short,第三次为char,然后组合得到整型数据。而如果变量在自然对齐位置上,则只要一次就可以取出数据。

各个硬件平台对存储空间的处理上有很大的不同,一些平台对某些特定类型的数据只能从某些特定地址开始存取。比如有些架构的CPU在访问一个没有进行对齐的变量的时候会发生错误,那么在这种架构下编程必须保证字节对齐。比如sparc系统,如果取未对齐的数据会发生错误,举个例:

char ch[8]; char *p = &ch[1]; int i = *(int *)p;

运行时会报segment error,而在x86上就不会出现错误,只是效率下降。

如何处理字节对齐

先让我们看编译器是按照什么样的原则进行对齐的:

  1. 数据类型自身的对齐值:为指定平台上基本类型的长度。对于char型数据,其自身对齐值为1,对于short型为2,对于int,float,double类型,其自身对齐值为4,单位字节。
  2. 结构体或者类的自身对齐值:其成员中自身对齐值最大的那个值。
  3. 指定对齐值:#pragma pack (value)时的指定对齐值value。
  4. 数据成员、结构体和类的有效对齐值:自身对齐值和指定对齐值中小的那个值。

当数据类型为结构体时,编译器可能需要在结构体字段的分配中插入间隙,以保证每个结构元素都满足它的对齐要求。第一个数据变量的起始地址就是数据结构的起始地址。结构体的成员变量要对齐排放(对于非对齐成员需要在其前面填充一些字节,保证其在对齐位置上),结构体本身也要根据自身的有效对齐值圆整(就是结构体总长度需要是结构体有效对齐值的整数倍),此时可能需要在结构末尾填充一些空间,以满足结构体整体的对齐—-向结构体元素中最大的元素对齐。

通过上面的分析,对结构体进行字节对齐,我们需要知道四个值:

  • 指定对齐值:代码中指定的对齐值,记为packLen;
  • 默认对齐值:结构体中每个数据成员及结构体本身都有默认对齐值,记为defaultLen;
  • 成员偏移量:即相对于结构体起始位置的长度,记为offset;
  • 成员长度:结构体中每个数据成员的长度(注结构体成员为补齐之后的长度),记为memberLen。

及两个规则:

  1. 对齐规则: offset % vaildLen = 0,其中vaildLen为有效对齐值vaildLen = min(packLen, defaultLen)
  2. 填充规则: 如成员变量不遵守对齐规则,则需要对其补齐;在其前面填充一些字节保证该成员对齐。需填充的字节数记为pad

Linux和Microsoft Windows的对齐方式

一.Linux的对齐策略:

在Linux中2字节数据类型(例如short)的地址必须是2的倍数,而较大的数据类型(例如int,int *,float和double)的地址必须是4的倍数。也就是说Linux下要么2字节对齐,要么4字节对齐,没有其他格式的对齐。

二.Microsoft Windows的对齐策略:

在Windows中对齐要求更严–任何K字节基本对象的地址都必须是K的倍数,K=2,4,或者8.特别地,double或者long long类型数据的地址应该是8的倍数。可以看出Windows的对齐策略和Linux还是不同的。

更改C编译器的缺省字节对齐方式

在缺省情况下,C编译器为每一个变量或是数据单元按其自然对界条件分配空间。一般地,可以通过下面的方法来改变缺省的对界条件:

  • 使用伪指令#pragma pack (n),C编译器将按照n个字节对齐。
  • 使用伪指令#pragma pack (),取消自定义字节对齐方式。

另外,还有如下的一种方式:

  • __attribute((aligned (n))),让所作用的结构成员对齐在n字节自然边界上。如果结构中有成员的长度大于n,则按照最大成员的长度来对齐。
  • __attribute__ ((packed)),取消结构在编译过程中的优化对齐,按照实际占用字节数进行对齐。

字节对齐的作用不仅是便于cpu快速访问,同时合理的利用字节对齐可以有效地节省存储空间。

对于32位机来说,4字节对齐能够使cpu访问速度提高,比如说一个long类型的变量,如果跨越了4字节边界存储,那么cpu要读取两次,这样效率就低了。但是在32位机中使用1字节或者2字节对齐,反而会使变量访问速度降低。所以这要考虑处理器类型,另外还得考虑编译器的类型。在vc中默认是4字节对齐的,GNU gcc 也是默认4字节对齐。

什么时候需要设置对齐

在设计不同CPU下的通信协议时,或者编写硬件驱动程序时寄存器的结构这两个地方都需要按一字节对齐。即使看起来本来就自然对齐的也要使其对齐,以免不同的编译器生成的代码不一样.

结构体举例

例子1

/ > File Name: struct_test.c > Author:Marvin > Created Time: Thu 22 Mar 2018 07:19:46 PM CST / #include 
   
   int main() { struct test { 
   char a; 
   short b; 
   int c; 
   long d; }; struct test t = { 
    
   'a', 
   11, 
   11, 
   11}; printf( 
   "size of struct t = %u\n", sizeof(t)); 
   return 
   0; } 
  

在64位centos上编译编译后结构struct test的布局如下:

struct_ex1

由于要保证结构体每个元素都要数据对齐,因此必须在a和b之间插入1字节的间隙使得后面的short元素2字节对齐int元素4字节对齐long元素8字节对齐,这样最终test结构大小为16字节。

运行程序结果为:

size of struct t = 16

例子2

现在考虑这样一个结构体:

struct test2 { int a; long b; char c; }; struct test2 t2 = { 
  11,11,'c'};

在64位centos上编译编译后结构struct test2的布局如下:

struct_ex2

结构体struct test2的自然对界条件为8字节,所以需要在最后的char型数据后面再填充7个字节使得结构体整体对齐。

运行程序结构为

size of struct test2 = 24

例子3

不妨将结构体struct test2里面成员的顺序重新排列一下:

struct test3 { char c; int a; long b; }; struct test3 t3 = { 
  'c',11,11};

在64位centos上编译编译后结构struct test2的布局如下:

struct_ex3

运行结果为:

size of struct test3 = 16

可见适当地编排结构体成员地顺序,可以在保存相同信息地情况下尽可能节约内存空间。

例子4

struct B { char b; int a; short c; };
#pragma pack (2) /*指定按2字节对齐*/ struct C { char b; int a; short c; }; #pragma pack () /*取消指定对齐,恢复缺省对齐*/

第一个变量b的自身对齐值为1,指定对齐值为2,所以,其有效对齐值为1,假设C从0x0000开始,那么b存放在0x0000,符合0x0000%1=0;第二个变量,自身对齐值为4,指定对齐值为2,所以有效对齐值为2,所以顺序存放在0x0002、0x0003、0x0004、0x0005四个连续字节中,符合0x0002%2=0。第三个变量c的自身对齐值为2,所以有效对齐值为2,顺序存放在0x0006、0x0007中,符合0x0006%2=0。所以从0x0000到0x00007共八字节存放的是C的变量。又C的自身对齐值为4,所以C的有效对齐值为2。又8%2=0,C只占用0x0000到0x0007的八个字节。所以sizeof(struct C)=8.

对于结构体嵌套地情况,结构体对齐算法思想:深度优先填充。

padLen = getPadLen(offset , defaultLen); int getPadLen(int offsetLen, int defaultLen) { int vaildLen = min(packLen,defaultLen); if(0 == vaildLen || 0 == offsetLen % vaildLen) { return 0; } return vaildLen - (offsetLen % vaildLen); }

先对齐内层结构体:对每个数据成员计算其defaultLen、memberLen和offset;

再遍历每个数据成员时计算:对于基本数据类型成员defaultLen=memberLen;对于结构体成员defaultLen等于它的所有成员的最大的memberLen;遍历时对成员的memberLen进行累加,得到当前成员的offsetLen;

运用对齐及填充规则:在当前结构体成员前填充padLen个字节;

下面是结构体作为成员的例子:

struct test1 { int a; long b; }; struct test4 { char a; struct test1 b; int c; }; struct test4 t4 = { 
  'a', { 
  11,11},11}

test1的内存分布:

struct_ex6-1

test4的内存分布:

struct_ex6-2

字节对齐可能带来的隐患

代码中关于对齐的隐患,很多是隐式的。比如在强制类型转换的时候。例如:

unsigned int i = 0x; unsigned char *p=NULL; unsigned short *p1=NULL; p=&i; *p=0x00; p1=(unsigned short *)(p+1); *p1=0x0000;

如何查找与字节对齐方面的问题

如果出现对齐或者赋值问题首先查看

  1. 编译器的big little端设置
  2. 看这种体系本身是否支持非对齐访问
  3. 如果支持看设置了对齐与否,如果没有则看访问时需要加某些特殊的修饰来标志其特殊访问操作

举例:

#include 
    using namespace std; //windows 64 位默认 结构体对齐系数为8,32位 结构体对齐系数为4 //测试系统对齐系数 // #pragma pack(8) my_struct_1 为16字节 // #pragma pack(4) my_struct_1 为12字节 // 不加#pragma pack(8) my_struct_1 为16字节 //顾系统默认对齐系数为8 struct my_struct_1 { char a; //1 double b; //之前补7 +8 8/8==1 }; #pragma pack(4) struct my_struct_2 { char a; //1 double b; //3+8 int c; //4 16/4=4 }; #pragma pack() #pragma pack(2) struct my_struct_3 { char a; //1 double b; //1+8 int c; //4 14/2 }; #pragma pack() #pragma pack(4) struct my_struct_4 { char a[5]; //5 double b; //3+8 16/4 }; #pragma pack() #pragma pack(2) struct my_struct_5 { char a[5]; //5 double b; //1+8 14/2 }; #pragma pack() #pragma pack(4) struct my_struct_6 { char a; //1 char b[3]; //3 char c; //1 1+3+1 }; #pragma pack() #pragma pack(4) struct my_struct_7 { char a; //1 char b[3]; //3 char c; //1  int d; //补齐 3 +4  }; #pragma pack() #pragma pack(4) struct test { char x1; //1 short x2; //补齐1+ 2 float x3; //4 char x4; //1 补齐+3  }; #pragma pack() int main() { cout<<"char:"<<sizeof(char)< 
  
    cout<< 
   "short:"<< 
   sizeof( 
   short)< 
   
     cout<< 
    "int:"<< 
    sizeof( 
    int)< 
    
      cout<< 
     "long:"<< 
     sizeof( 
     long)< 
     
       cout<< 
      "float:"<< 
      sizeof( 
      float)< 
      
        cout<< 
       "double:"<< 
       sizeof( 
       double)< 
       
         cout<< 
        "long double:"<< 
        sizeof( 
        long 
        double)< 
        
          cout<< 
         sizeof(my_struct_1)< 
         
           //8 
          cout<< 
          sizeof(my_struct_2)< 
          
            //16 
           cout<< 
           sizeof(my_struct_3)< 
           
             //14 
            cout<< 
            sizeof(my_struct_4)< 
            
              //16 
             cout<< 
             sizeof(my_struct_5)< 
             
               //14 
              cout<< 
              sizeof(my_struct_6)< 
              
                //5 
               cout<< 
               sizeof(my_struct_7)< 
               
                 //12 
                cout<< 
                sizeof(test)< 
                
                  //12 system( 
                 "pause"); 
                 return 
                 0; } 
                 
                
               
              
             
            
           
          
         
        
       
      
     
    
  

  1. 解析C语言中结构体struct的对齐问题
  2. 彻底搞清计算结构体大小和数据对齐原则
  3. 知识点总结——结构体大小、内存对齐方式
  4. C语言字节对齐、结构体对齐最详细的解释
  5. 深入理解计算机系统原书第2版
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/204946.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月19日 下午7:10
下一篇 2026年3月19日 下午7:10


相关推荐

  • 百度文心一言API调用全攻略:批量改写文章助力自媒体与网站优化

    百度文心一言API调用全攻略:批量改写文章助力自媒体与网站优化

    2026年3月12日
    1
  • Percona XtraDB Cluster安装

    Percona XtraDB Cluster安装PerconaXtrac 安装安装环境 CentOS7 6 软件准备 PerconaXtrac 7 下载地址 perconaxtrab 4 下载 qpress 下载开始正式的安装 yuminstallpe develperl DBIlibaionet tools 开始安装 qpressrpm ivhrpm ivhqpress 11 1 el7 x86 64 rpm 开始安装

    2026年3月18日
    3
  • 浏览器打开JSP文件只显示源代码的问题

    浏览器打开JSP文件只显示源代码的问题地址栏输入 http Tomcat 服务器二点 IP 地址 或域名 端口 JSP 页面的名字如 在 Tomcat 的 webapps 下新建 ch1 文件夹 里面存放 letter jsp 文件 可输入地址 http localhost 8080 ch1 letter jsp

    2026年3月26日
    2
  • 微信模拟位置想在哪就在哪(GPS欺骗)

    微信模拟位置想在哪就在哪(GPS欺骗)微信模拟位置是通过位置欺骗,让微信误以为我们就在当前的位置进行周边好友的搜索与添加。这是一个很老的功能,为什么说很老呢?因为这是在android4.1的时候流行的一个功能,android在4.4推出后这个功能基本不能使用了!即使很老但是最近也碰到了这样的需求,不过针对特殊的群体,手机定制而来,就没有限制了!首先我们要知道怎么用:首先:我们从设置里找到开发者选项(开发者都知道):在这里就是,开发人

    2022年4月30日
    56
  • sqlmap安装教程用w+r打开(sqlyog安装步骤)

    sqlmap安装教程需要工具:sqlmap、python2或3、计算机自带的CMD一、工具安装1、自行上官网安装sqlmap、python2或32、首先安装python可以无脑点继续,但是在下图的安装选项中,最后一个选项涉及后期环境搭建,可以选择安装,也可以不安,后期手动添加3、将安装的sqlmap文件夹打开并固定一个名字(SQLMap)4、将SQLMap打开会发现有一个很长串的文件夹,点开并将里面的文件全部剪切到SQLMap这个文件的目录下5、将SQLMap文件夹放入已安装好的pytho

    2022年4月18日
    49
  • STM32单片机介绍_单片机智能控制DIY

    STM32单片机介绍_单片机智能控制DIYSTM32库函数开发系列文章目录第一篇:STM32F103ZET6单片机双串口互发程序设计与实现第二篇:最简单DIY基于STM32单片机的蓝牙智能小车设计方案第三篇:最简单DIY基于STM32F407探索者开发板的MPU6050陀螺仪姿态控制舵机程序第四篇:最简单DIY基于STM32F407探索者开发板和PCA9685舵机控制模块的红外遥控机械臂控制程序第五篇:注释最详细、代码最简单的STM32+摄像头+显示屏的颜色跟踪电路软硬件方案第六篇:最简单DIY基于STM32单片机的WIFI智能小车设计

    2022年10月17日
    6

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号