2022-2023-1 20221421 《计算机基础与程序设计》第十二周学习总结

作业信息

班级链接：https://edu.cnblogs.com/campus/besti/2022-2023-1-CFAP
作业要求：https://www.cnblogs.com/rocedu/p/9577842.html#WEEK12
作业正文：2022-2023-1 20221312 《计算机基础与程序设计》第十二周学习总结 - 221421李旻奇 - 博客园 (cnblogs.com)

这周对于C语言的进度推得很快，已经学完多文件代码了，对于头文件的本质有了一定的了解，就此我一直追求的破解代码冗余的手段又多了一种，目前与有了三种，封装，声明与引用，多文件，最让我感到惊奇的是我在第三周总结里写到C语言是一门良好设计的语言，在此有了更深刻的体会，目前我能举出更有力的证据：

typedef函数在C语言程序设计中只是作为命名别名的手段，但是没提及别名是对可移植性的最大的提高，我们知道在不同的编译器下不同的数据类型可能占据不同的的大小，例如4字节大小在VS code中是int但是在其他编译器中可能是long，因此命名别名就具有更多适配意义。

还有一个重要的定义是内存对齐在此仔细讨论

什么是内存对齐

元素是按照定义顺序一个一个放到内存中去的，但并不是紧密排列的。从结构体存储的首地址开始，每个元素放置到内存中时，它都会认为内存是按照自己的大小（通常它为4或8）来划分的，因此元素放置的位置一定会在自己宽度的整数倍上开始，这就是所谓的内存对齐。

理论上，int占4byte，char占一个byte，那么将它们放到一个结构体中应该占4+1=5byte；但是实际上，通过运行程序得到的结果是8 byte，这就是内存对齐所导致的。

#include<stdio.h> struct{ int x; char y; }Test; int main() { printf("%d\n",sizeof(Test)); // 输出8不是5 return 0; }

为什么要内存对齐

平台原因(移植原因)：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。
性能原因：数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问。

假如没有内存对齐机制，数据可以任意存放，现在一个int变量存放在从地址1开始的联系四个字节地址中，该处理器去取数据时，要先从0地址开始读取第一个4字节块,剔除不想要的字节（0地址）,然后从地址4开始读取下一个4字节块,同样剔除不要的数据（5，6，7地址）,最后留下的两块数据合并放入寄存器。这需要做很多工作。
现在有了内存对齐的，int类型数据只能存放在按照对齐规则的内存中，比如说0地址开始的内存。那么现在该处理器在取数据时一次性就能将数据读出来了，而且不需要做额外的操作，提高了效率。

内存对齐规则

基本类型的对齐值就是其sizeof值;
数据成员对齐规则：结构(struct)(或联合(union))的数据成员，第一个数据成员放在offset为0的地方，以后每个数据成员的对齐按照#pragma pack指定的数值和这个数据成员自身长度中，比较小的那个进行;
结构(或联合)的整体对齐规则：在数据成员完成各自对齐之后，结构(或联合)本身也要进行对齐，对齐将按照#pragma pack指定的数值和结构(或联合)最大数据成员长度中，比较小的那个进行;
#include<stdio.h> struct { int i; char c1; char c2; }Test1; struct{ char c1; int i; char c2; }Test2; struct{ char c1; char c2; int i; }Test3; int main() { printf("%d\n",sizeof(Test1)); // 输出8 printf("%d\n",sizeof(Test2)); // 输出12 printf("%d\n",sizeof(Test3)); // 输出8 return 0; }
默认#pragma pack(4)，且结构体中最长的数据类型为4个字节，所以有效对齐单位为4字节，下面根据上面所说的规则以第二个结构体来分析其内存布局：首先使用规则1，对成员变量进行对齐：
- sizeof(c1) = 1 <= 4(有效对齐位)，按照1字节对齐，占用第0单元；
- sizeof(i) = 4 <= 4(有效对齐位)，相对于结构体首地址的偏移要为4的倍数，占用第4，5，6，7单元；
- sizeof(c2) = 1 <= 4(有效对齐位)，相对于结构体首地址的偏移要为1的倍数，占用第8单元；
然后使用规则2，对结构体整体进行对齐：

第二个结构体中变量i占用内存最大占4字节，而有效对齐单位也为4字节，两者较小值就是4字节。因此整体也是按照4字节对齐。由规则1得到s2占9个字节，此处再按照规则2进行整体的4字节对齐，所以整个结构体占用12个字节。

根据上面的分析，不难得出上面例子三个结构体的内存布局如下：

例子三个结构体的内存布局

更改C编译器的缺省字节对齐方式：

在缺省情况下，C编译器为每一个变量或是数据单元按其自然对界条件分配空间。一般地，可以通过下面的方法来改变缺省的对界条件：
- 使用伪指令#pragma pack (n)，C编译器将按照n个字节对齐。
- 使用伪指令#pragma pack ()，取消自定义字节对齐方式。
另外，还有如下的一种方式：
- __attribute((aligned (n)))，让所作用的结构成员对齐在n字节自然边界上。如果结构中有成员的长度大于n，则按照最大成员的长度来对齐。
- attribute((packed))，取消结构在编译过程中的优化对齐，按照实际占用字节数进行对齐。
不同平台上编译器的 pragma pack 默认值不同。而我们可以通过预编译命令#pragma pack(n), n= 1,2,4,8,16来改变对齐系数。

例如，对于上个例子的三个结构体，如果前面加上#pragma pack(1)，那么此时有效对齐值为1字节，此时根据对齐规则，不难看出成员是连续存放的，三个结构体的大小都是6字节。

有效对齐值为1字节

如果前面加上#pma pack(2)，有效对齐值为2字节，此时根据对齐规则，三个结构体的大小应为6,8,6
分析问题

在存储某些数据时，其实际需求的数据长度可能要小于一个字节，只占一位或几位。为了节省空间，处理方便，在C中引入了另一种结构，称为“位域”或“位段”。

所谓“位域”，就是把一个字节中的“位”按照实际的需求分成不同的区域，表明每个区域位数、区域的域名，并允许程序按照域名进行操作。如此就可以把不同的对象用一个字节来表示。

位域的定义与结构定义相仿，其形式为：
struct 位域的结构体名 { //位域列表 }
位域列表的形式为：【类型说明符】【位域名】：【位域的长度】例如：

struct ab { int a:8; int b:2; int c:6; }

对于位域的定义，有以下几点说明：

（1）一个位域必须存储在同一个字节中，不能跨两个字节。如一个字节所剩空间不够存放另一位域时，应从下一单元起存放该位域。也可以有意使某位域从下一单元开始。

例如：

struct wy { unsigned a:6; unsigned 0; //空域 unsigned b:4; //从一单元开始存放 unsigned c:4; }

在这个位域定义中，a占第一字节的6位，后2位填0表示不使用，b从第二字节开始，占用4位，c占用4位
2）由于位域不允许跨两个字节，因此位域的长度不能大于一个字节的长度，也就是不能超过8位二进位。

（3）位域可以无位域名，这时它只用来填充或调整位置。无名的位域是不能使用的。

例如：
struct wk { int a:1; int :2; //不能使用 int b:3; int c:2; }

posted @ 2022-11-18 22:34 221421李旻奇阅读(55) 评论(0) 收藏举报

刷新页面返回顶部

lmq221421

2022-2023-1 20221421 《计算机基础与程序设计》第十二周学习总结

作业信息

什么是内存对齐

为什么要内存对齐

内存对齐规则

分析问题

公告