C语言union关键字
union 关键字的用法与struct 的用法非常类似,但也有很大的不同。
union 维护足够的空间来置放多个数据成员中的“一种”,而不是为每一个数据成员配置空间,在union 中所有的数据成员共用一个空间,同一时间只能储存其中一个数据成员,所有的数据成员具有相同的起始地址。例子如下:
union StateMachine
{
char character;
int number;
char *str;
double exp;
};
一个union 只配置一个足够大的空间以来容纳最大长度的数据成员,以上例而言,最大长度是double 型态,所以StateMachine 的空间大小就是double 数据类型的大小。
在C++里,union 的成员默认属性页为public。union 主要用来压缩空间。如果一些数据不可能在同一时间同时被用到,则可以使用union。
一、大小端模式对union 类型数据的影响
下面再看一个例子:
union
{
int i;
char a[2];
}*p, u;
p =&u;
p->a[0] = 0x1;
p->a[1] = 0x2;
p.i 的值应该为多少呢?
这里需要考虑存储模式:大端模式和小端模式。
1. 大端模式(Big_endian):字数据的高字节存储在低地址中,而字数据的低字节则存放在高地址中。
2. 小端模式(Little_endian):字数据的高字节存储在高地址中,而字数据的低字节则存放在低地址中。
union 型数据所占的空间等于其最大的成员所占的空间。对union 型的成员的存取都是相对于该联合体基地址的偏移量为0 处开始,也就是联合体的访问不论对哪个变量的存取都是从union 的首地址位置开始。如此一解释,上面的问题是否已经有了答案呢?大端是
二、如何用程序确认当前系统的存储模式?
上述问题似乎还比较简单,那来个有技术含量的:请写一个C 函数,若处理器是Big_endian 的,则返回0;若是Little_endian 的,则返回1。
先分析一下,按照上面关于大小端模式的定义,假设int 类型变量i 被初始化为1。
以大端模式存储,其内存布局如下图:
以小端模式存储,其内存布局如下图:
变量i 占4 个字节,但只有一个字节的值为1,另外三个字节的值都为0。如果取出低地址上的值为0,毫无疑问,这是大端模式;如果取出低地址上的值为1,毫无疑问,这是小端模式。既然如此,我们完全可以利用union 类型数据的特点:所有成员的起始地址一致。
到现在,应该知道怎么写了吧?参考答案如下:
int checkSystem( )
{
union check
{
int i;
char ch;
} c;
c.i = 1;
return (c.ch ==1);
}
现在你可以用这个函数来测试你当前系统的存储模式了。当然你也可以不用函数而直接去查看内存来确定当前系统的存储模式。如下图:
图中0x01 的值存在低地址上,说明当前系统为小端模式。
不过要说明的一点是,某些系统可能同时支持这两种存储模式,你可以用硬件跳线或在编译器的选项中设置其存储模式。
留个问题:在x86 系统下,输出的值为多少?
#include<stdio.h>
int main()
{
int a[9]={1,2,3,4,5,6,7,8,9};
int*ptr1=(int*)(&a+1);
int*ptr2=(int*)((int)a+1);
printf("%x,%x",ptr1[-1],*ptr2);
return 0;
}
可以告诉大家的是答案是:
9,2000000
问题来,为什么是9和2000000 。这个答案估计是没有人能够料想得到的吧!如果你以前从来没有看过这个问题,现在一眼就看出这个问题的答案的话,那么你就是传说中顶尖高手中的高手,C语言已经达到如火纯青的地步。 难得的人才啊!其实这里有很多的问题需要解决,这不是一道普通的C语言的题目,而是一题高级的C语言题目,它涉及的知识面都让我震惊。这个输出的结果会让很多写过C语言的同学感到困惑不已!
ptr1[-1]= *(ptr1 - 1) 由于ptr1是指针,指向数组a后面的下一个元素,而ptr1-1就是ptr1这个指针往前移动一个单位,移动之后这个指针指向了数组a的最后一个元素。所以就有*(ptr1-1)=9。这个还算好理解,重点是下面那一条命令比较纠结啊
对于ptr2而言,a是数组首元素的首地址,(int)a即把这个地址强制转换为int型数据,然后(int)a+1很简单,就是int型数据的相加。(int*)((int)a+1)就是再把这个int型的数据再强制型转换为int类型的指针,最后再把这个指针赋给int型的ptr2指针,并且将其打印成十六进制的形式。 因为我们的pc机采用的小端存储(这个很重要)这个时候,
数组a的内存布局(16进制):01000000 02000000 03000000 04000000 05000000 06000000 07000000 08000000 09000000
而 (int)a+1是向后移动了一个字节,即000000 02 由于是小端的方式,且以16进制的形式显示,所以就有了2000000的值出来