C/C++ struct、union

1. 结构体(struct)

1.1 结构体的概念

  • 结构体(struct):是由一系列具有相同类型或不同类型的数据构成的数据集合,叫做结构。
  • 结构体(struct):是一种复合数据类型,结构类型。
  • 注:“结构”是一种构造类型,它是由若干“成员”组成的。 每一个成员可以是一个基本数据类型或者又是一个构造类型。 结构即是一种“构造”而成的数据类型, 那么在说明和使用之前必须先定义它,也就是构造它。如同在说明和调用函数之前要先定义一样。

1.2 C语言中的结构体

  • 说明:在C语言中,结构体(struct)是复合数据类型的一种。同时也是一些元素的集合,这些元素称为结构体的成员,且这些成员可以为不同的类型,成员一般用名字访问。结构体可以被声明为变量、指针或数组等,用以实现较复杂的数据结构。
  • 注:在C语言中,结构体不能包含函数。
  • 定义与声明: (1)示例代码一:

  • struct tag{
        member-list
    }variable-list;

    注:struct为结构体关键字;tag为结构体的标志;member-list为结构体成员变量列表,其必须列出其所有成员;variable-list为此结构体声明的变量;

  • (2)示例代码二:

  • //此声明声明了拥有3个成员的结构体,分别为整型的a,字符型的b和双精度的c,但没有标明其标签,声明了结构体变量s1
    struct{
        int a;
        char b;
        double c;
    }s1;
    
    //此声明声明了拥有3个成员的结构体,分别为整型的a,字符型的b和双精度的c,结构体的标签被命名为SIMPLE,用SIMPLE标签的结构体,另外声明了变量t1, t2[20], *t3
    struct SIMPLE{
        int a;
        char b;
        double c;
    };
    SIMPLE t1, t2[20], *t3;
    
    //可以用typedef创建新类型,此声明声明了拥有3个成员的结构体,分别为整型的a,字符型的b和双精度的c,结构体的标签被命名为Simple2,用Simple2作为类型声明新的结构体变量u1, u2[20], *u3
    typedef struct{
        int a;
        char b;
        double c;
    }Simple2;
    Simple2 u1, u2[20], *u3;//若去掉typedef则编译报错,error C2371: “Simple2”: 重定义;不同的基类型
    

      

  • 注:在上面的声明中,第一个和第二声明被编译器当作两个完全不同的类型,即使他们的成员列表是一样的,如果令t3=&s1,则是非法的。

  •  

    在一般情况下,tag、member-list、variable-list这3部分至少要出现2个。

 

1.3 C++中的结构体

  • 说明:在C语言中,结构体不能包含函数。在面向对象的程序设计中,对象具有状态(属性)和行为,状态保存在成员变量中,行为通过成员方法(函数)来实现。C语言中的结构体只能描述一个对象的状态,不能描述一个对象的行为。在C++中,考虑到C语言到C++语言过渡的连续性,对结构体进行了扩展,C++的结构体可以包含函数,这样,C++的结构体也具有类的功能,与class不同的是,结构体包含的函数默认为public,而不是private。
  • 注:在C++中,结构体可以包含函数。
  • 定义与声明:

  • (1)示例代码一:

  • struct tag{
        member-list
    }variable-list;
    
  • 注:struct为结构体关键字;tag为结构体的标志;member-list为结构体成员变量及成员函数列表,其必须列出其所有成员;variable-list为此结构体声明的变量;
  • (2)示例代码二:
  • #include <iostream>
    
    using namespace std;
    
    struct SAMPLE
    {
        int x;
        int y;
        int add() {return x+y;}
    }s1;
    
    int main()
    {
        cout<<"没初始化成员变量的情况下:"<<s1.add()<<endl;
        s1.x = 3;
        s1.y = 4;
        cout<<"初始化成员变量的情况下:"<<s1.add()<<endl;
        system("pause");
        return 0;
    }
    =>没初始化成员变量的情况下:0
      初始化成员变量的情况下:7

 

1.4 结构体的作用

  • 在实际项目中,结构体是大量存在的。研发人员常使用结构体来封装一些属性来组成新的类型。由于C语言内部程序比较简单,研发人员通常使用结构体创造新的“属性”,其目的是简化运算。
  • 结构体在函数中的作用不是简便,最主要的作用就是封装。封装的好处就是可以再次利用。让使用者不必关心这个是什么,只要根据定义使用就可以了。

 

1.5 结构体的大小与内存对齐

  • 默认的对齐方式:各成员变量在存放的时候根据在结构中出现的顺序依次申请空间,同时按照上面的对齐方式调整位置,空缺的字节VC会自动填充。同时VC为了确保结构的大小为结构的字节边界数(即该结构中占用最大空间的类型所占用的字节数)的倍数,所以在为最后一个成员变量申请空间后,还会根据需要自动填充空缺的字节。

  • 注:VC对变量存储的一个特殊处理。为了提高CPU的存储速度,VC对一些变量的起始地址做了“对齐”处理。在默认情况下,VC规定各成员变量存放的起始地址相对于结构的起始地址的偏移量必须为该变量的类型所占用的字节数的倍数。

  • (1)示例代码一:

  • struct MyStruct
    {
        double dda1;
        char dda;
        int type;
    };
    //错:sizeof(MyStruct)=sizeof(double)+sizeof(char)+sizeof(int)=13。
    //对:当在VC中测试上面结构的大小时,你会发现sizeof(MyStruct)为16。
  • 注:为上面的结构分配空间的时候,VC根据成员变量出现的顺序和对齐方式。

    • (1)先为第一个成员dda1分配空间,其起始地址跟结构的起始地址相同(刚好偏移量0刚好为sizeof(double)的倍数),该成员变量占用sizeof(double)=8个字节;

    • (2)接下来为第二个成员dda分配空间,这时下一个可以分配的地址对于结构的起始地址的偏移量为8,是sizeof(char)的倍数,所以把dda存放在偏移量为8的地方满足对齐方式,该成员变量占用sizeof(char)=1个字节;

    • (3)接下来为第三个成员type分配空间,这时下一个可以分配的地址对于结构的起始地址的偏移量为9,不是sizeof(int)=4的倍数,为了满足对齐方式对偏移量的约束问题,VC自动填充3个字节(这三个字节没有放什么东西),这时下一个可以分配的地址对于结构的起始地址的偏移量为12,刚好是sizeof(int)=4的倍数,所以把type存放在偏移量为12的地方,该成员变量占用sizeof(int)=4个字节;

  • 这时整个结构的成员变量已经都分配了空间,总的占用的空间大小为:8+1+3+4=16,刚好为结构的字节边界数(即结构中占用最大空间的类型所占用的字节数sizeof(double)=8)的倍数,所以没有空缺的字节需要填充。所以整个结构的大小为:sizeof(MyStruct)=8+1+3+4=16,其中有3个字节是VC自动填充的,没有放任何有意义的东西。

  • (2)示例代码二:交换一下上述例子中MyStruct的成员变量的位置

  • struct MyStruct
    {
        char dda;
        double dda1;
        int type;
    };
    //错:sizeof(MyStruct)=sizeof(double)+sizeof(char)+sizeof(int)=13。
    //对:当在VC中测试上面结构的大小时,你会发现sizeof(MyStruct)为24。
  • 注:为上面的结构分配空间的时候,VC根据成员变量出现的顺序和对齐方式。

    • (1)先为第一个成员dda分配空间,其起始地址跟结构的起始地址相同(刚好偏移量0刚好为sizeof(char)的倍数),该成员变量占用sizeof(char)=1个字节;

    • (2)接下来为第二个成员dda1分配空间,这时下一个可以分配的地址对于结构的起始地址的偏移量为1,不是sizeof(double)=8的倍数,需要补足7个字节才能使偏移量变为8(满足对齐方式),因此VC自动填充7个字节,dda1存放在偏移量为8的地址上,它占用8个字节;

    • (3)接下来为第三个成员type分配空间,这时下一个可以分配的地址对于结构的起始地址的偏移量为16,是sizeof(int)=4的倍数,满足int的对齐方式,所以不需要VC自动填充,type存放在偏移量为16的地址上,该成员变量占用sizeof(int)=4个字节; 这时整个结构的成员变量已经都分配了空间,总的占用的空间大小为:1+7+8+4=20,不是结构的节边界数(即结构中占用最大空间的类型所占用的字节数sizeof(double)=8)的倍数,所以需要填充4个字节,以满足结构的大小为sizeof(double)=8的倍数。所以该结构总的大小为:sizeof(MyStruct)为1+7+8+4+4=24。其中总的有7+4=11个字节是VC自动填充的,没有放任何有意义的东西。

  • 字节的对齐方式:

  • 在VC中提供了#pragmapack(n)来设定变量以n字节对齐方式。n字节对齐就是说变量存放的起始地址的偏移量有两种情况:第一,如果n大于等于该变量所占用的字节数,那么偏移量必须满足默认的对齐方式;第二,如果n小于该变量的类型所占用的字节数,那么偏移量为n的倍数,不用满足默认的对齐方式。结构的总大小也有个约束条件,分下面两种情况:如果n大于所有成员变量类型所占用的字节数,那么结构的总大小必须为占用空间最大的变量占用的空间数的倍数;否则必须为n的倍数。

  • 注:VC对结构的存储的特殊处理确实提高了CPU存储变量的速度,但有时也会带来一些麻烦,我们也可以屏蔽掉变量默认的对齐方式,自己来设定变量的对齐方式。

  • (1)示例代码:

    #pragmapack(push)//保存对齐状态
    
    
    #pragmapack(4)//设定为4字节对齐
    
    struct test
    {
        char m1;
        double m4;
        int m3;
    };
    
    #pragmapack(pop)//恢复对齐状态

    注:以上结构的大小为16,下面分析其存储情况。

    • (1)首先为m1分配空间,其偏移量为0,满足我们自己设定的对齐方式(4字节对齐),m1占用1个字节;

    • (2)接着开始为m4分配空间,这时其偏移量为1,需要补足3个字节,这样使偏移量满足为n=4的倍数(因为sizeof(double)大于n),m4占用8个字节;

    • (3)接着为m3分配空间,这时其偏移量为12,满足为4的倍数,m3占用4个字节; 这时已经为所有成员变量分配了空间,共分配了16个字节,满足为n的倍数。如果把上面的#pragmapack(4)改为#pragma pack(8),那么我们可以得到结构的大小为24。

 

C 语言 struct 和 C++struct 区别

1) C 语言中:struct 是用户自定义数据类型(UDT);C++中 struct 是抽象数据类型(ADT),支持成员函数的定义,(C++中的struct能继承,能实现多态)。

2) C 中 struct 是没有权限的设置的,且 struct 中只能是一些变量的集合体,可以封装数据却不可以隐藏数据,而且成员不可以是函数。

3) C++中,struct 的成员默认访问说明符为 public(为了与 C 兼容),class 中的默认访问限定符为 private,struct 增加了访问权限,且可以和类一样有成员函数。

4) struct作为类的一种特例是用来自定义数据结构的。一个结构标记声明后,在C中必须在结构标记前加上struct,才能做结构类型名。

 

C++中struct和class的区别

在C++中,class和struct做类型定义是只有两点区别:

1.默认继承权限不同,class继承默认是private继承,而struct默认是public继承。

2.class还可用于定义模板参数,像typename,但是关键字struct不能用于于定义模板参数。

C++保留struct关键字的原因

1.保证与C语言的向下兼容性,C++必须提供一个struct。

2.C++中的struct定义必须百分百地保证与C语言中的struct的向下兼容性,把C++中的最基本的对象单元规定为class而不是struct,就是为了避免各种兼容性要求的限制。

3.对struct定义的扩展使C语言的代码能够更容易的被移植到C++中。

union、struct

1) C与C++中的union:一种数据格式,能够存储不同的数据类型,但只能同时存储其中的一种类型。C++ union结构是一种特殊的类。它能够包含访问权限、成员变量、成员函数(可以包含构造函数和析构函数)。它不能包含虚函数和静态数据变量。它也不能被用作其他类的基类,它本身也不能有从某个基类派生而来。Union中得默认访问权限是public。union类型是共享内存的,以size最大的结构作为自己的大小。每个数据成员在内存中的起始地址是相同的。

2) 在C/C++程序的编写中,当多个基本数据类型或复合数据结构要占用同一片内存时,我们要使用联合体;当多种类型,多个对象,多个事物只取其一时(我们姑且通俗地称其为“n 选1”),我们也可以使用联合体来发挥其长处。在某一时刻,一个union中只能有一个值是有效的。union的一个用法就是可以用来测试CPU是大端模式还是小端模式

posted @ 2021-08-30 18:52  默行于世  阅读(311)  评论(0编辑  收藏  举报