深入理解计算机各种类型大小（sizeof）

Cpp代码

// Example of the sizeof keyword
size_t i = sizeof( int );
struct align_depends {
char c;
int i;
};
size_t size = sizeof(align_depends); // The value of size depends on
// the value set with /Zp or
// #pragma pack
int array[] = { 1, 2, 3, 4, 5 }; // sizeof( array ) is 20
// sizeof( array[0] ) is 4
size_t sizearr = // Count of items in array
sizeof( array ) / sizeof( array[0] );

// Example of the sizeof keyword
size_t  i = sizeof( int ); 

struct align_depends {
    char c;
    int i;
};
size_t size = sizeof(align_depends);  // The value of size depends on 
                                   //  the value set with /Zp or 
                                   //  #pragma pack

int  array[] = { 1, 2, 3, 4, 5 };     // sizeof( array ) is 20 
                                      // sizeof( array[0] ) is 4 
size_t  sizearr =                        // Count of items in array
   sizeof( array ) / sizeof( array[0] );

<script src="ms-its:dsmsdn.chm::/html/msdn_footer.js"></script>

1. 用法

1.1 sizeof和new、delete等一样，是关键字，不是函数或者宏。

1.2 sizeof返回内存中分配的字节数，它和操作系统的位数有关。例如在常见的32位系统中，int类型占4个字节；但是在16位系统中，int类型占2个字节。

1.3 sizeof的参数可以是类型，也可以是变量，还可以是常量。对于相同类型，以上3中形式参数的sizeof返回值相同。

Cpp代码

int a;
sizeof(a); // = 4
sizeof(int); // = 4
sizeof(1); // = 4

int a;
sizeof(a); // = 4
sizeof(int); // = 4
sizeof(1); // = 4

1.4 C99标准规定，函数、不能确定类型的表达式以及位域（bit-field）成员不能被计算s
izeof值，即下面这些写法都是错误的。

Cpp代码

void fn() { }
sizeof(fn); // error：函数
sizeof(fn()); // error：不能确定类型
struct S
{
int a : 3;
};
S sa;
sizeof( sa.a ); // error：位域成员

void fn() { }
sizeof(fn); // error：函数
sizeof(fn()); // error：不能确定类型
struct S
{
	int a : 3;
}; 
S sa;  
sizeof( sa.a ); // error：位域成员

1.5 sizeof在编译阶段处理。由于sizeof不能被编译成机器码，所以sizeof的参数不能被编译，而是被替换成类型。

Cpp代码

int a = -1;
sizeof(a=3); // = sizeof(a) = sizeof(int) = 4
cout<<a<<endl; // 输出-1。由于“=”操作符返回左操作数的类型，赋值操作没有执行。

int a = -1;
sizeof(a=3); // = sizeof(a) = sizeof(int) = 4
cout<<a<<endl; // 输出-1。由于“=”操作符返回左操作数的类型，赋值操作没有执行。

2. 在32位系统中不同类型的内存分配

2.1 基本类型

Cpp代码

sizeof(int); // = 4
sizeof(double); // = 8
sizeof(char); // = 1
sizeof(bool); // = 1
sizeof(short); // = 2
sizeof(float); // = 4
sizeof(long); // = 4

sizeof(int);        // = 4
sizeof(double);     // = 8
sizeof(char);       // = 1
sizeof(bool);       // = 1
sizeof(short);      // = 2
sizeof(float);      // = 4
sizeof(long);       // = 4

2.2 指针

指针在32位系统中占4个字节。

Cpp代码

sizeof(int *); // = 4
sizeof(double *); // = 4
sizeof(char *); // = 4

sizeof(int *);         // = 4
sizeof(double *);      // = 4
sizeof(char *);        // = 4

2.3 数组

2.3.1 数组的sizeof返回整个数组所占的字节数，即（数组元素个数×每个元素所占字节）。

Cpp代码

int ai[] = {1, 2};
sizeof(ai); // = 2*4 = 8

int ai[] = {1, 2};
sizeof(ai);          // = 2*4 = 8

2.3.2 常量字符串与字符数组的内存分配方式相同。

Cpp代码

char ac[] = "abcd"; //注意数组末尾的字符串终结符'\0'
sizeof(ac); // = 5*1 = 5
sizeof("abcd"); // = 5*1 = 5

char ac[] = "abcd";  //注意数组末尾的字符串终结符'\0'
sizeof(ac);          // = 5*1 = 5
sizeof("abcd");      // = 5*1 = 5

2.3.3 数组和指针所占的字节数不同，应注意区分。

Cpp代码

int *pi = new int[10]; //这是指针
sizeof(pi); // = 4
int ai[10];
int *p = ai; //这还是指针
sizeof(p); // = 4
double* (*a)[3][6]; //看成(double *) (*a)[3][6]，即一个3×6的二维数组，数组元素为指针，指向double类型。
sizeof(a); // = 4，a为指向上述二维数组的指针
sizeof(*a); // = sizeof(double *)*3*6 = 72，*a表示上述二维数组
sizeof(**a); // = sizeof(double *)*6 = 24，**a即*(*a)，表示double*[6]，是元素为double指针的一维数组。
sizeof(***a); // = sizeof(double *) = 4，表示上述一维数组中的第一个元素，元素类型为double指针。
sizeof(****a); // = sizeof(double) = 8，表示上述数组首元素指向的double类型。

int *pi = new int[10]; //这是指针
sizeof(pi);            // = 4

int ai[10];
int *p = ai;           //这还是指针
sizeof(p);             // = 4

double* (*a)[3][6];    //看成(double *) (*a)[3][6]，即一个3×6的二维数组，数组元素为指针，指向double类型。
sizeof(a);             // = 4，a为指向上述二维数组的指针
sizeof(*a);            // = sizeof(double *)*3*6 = 72，*a表示上述二维数组    
sizeof(**a);           // = sizeof(double *)*6 = 24，**a即*(*a)，表示double*[6]，是元素为double指针的一维数组。
sizeof(***a);          // = sizeof(double *) = 4，表示上述一维数组中的第一个元素，元素类型为double指针。
sizeof(****a);         // = sizeof(double) = 8，表示上述数组首元素指向的double类型。

2.3.4 函数形式参数中的数组会蜕变为指针，原因是数组参数“传址调用”，调用者只需将实参的地址传递过去。有一种情况例外，那就是参数是指向数组的指针。

Cpp代码

void acf(char p[3]) //参数类型是int[]，表示指向int的指针
{
sizeof( p ); // = 4
}
void aif(int p[]) //参数类型是int[]，表示指向int的指针
{
sizeof( p ); // = 4
}
void pif(int (*p)[6]) //参数类型是int (*)[6]，表示指向int数组的指针
{
sizeof( p); // = 4
sizeof( *p ); // = sizeof(int)*6 = 24
}
void ppf(int *p[6]) //参数类型是int *[]，表示指向int指针的指针
{
sizeof( p ); // = 4
sizeof( *p ); // = 4
}

void acf(char p[3])     //参数类型是int[]，表示指向int的指针
{
    sizeof( p );        // = 4
}
void aif(int p[])       //参数类型是int[]，表示指向int的指针
{
    sizeof( p );        // = 4
}
void pif(int (*p)[6])   //参数类型是int (*)[6]，表示指向int数组的指针
{
    sizeof( p);         // = 4
    sizeof( *p );       // = sizeof(int)*6 = 24
}
void ppf(int *p[6])     //参数类型是int *[]，表示指向int指针的指针
{
    sizeof( p );        // = 4
    sizeof( *p );       // = 4
}

2.4. 类和结构体的内存分配。

2.4.1 空类或空结构体占一个字节。

Cpp代码

class CEmpty { };
sizeof(CEmpty); // = 1
struct SEmpty { };
sizeof(SEmpty); // = 1

class CEmpty { };
sizeof(CEmpty); // = 1

struct SEmpty { };
sizeof(SEmpty); // = 1

2.4.2 非空类和结构体所占字节为所有成员占字节的和，但是不包括成员函数和静态成员所占的空间。

Cpp代码

class CInt : public CEmpty {
int i;
};
sizeof(CInt); // = 4;
class CFunc {
void f() {}
};
sizeof(CFunc); // = 1;
struct SInt : SEmpty {
static int i;
};
sizeof(SInt); // = 1;

class CInt : public CEmpty {
	int i;
};
sizeof(CInt); // = 4;

class CFunc {
	void f() {}
};
sizeof(CFunc); // = 1;

struct SInt : SEmpty {
	static int i;
};
sizeof(SInt); // = 1;

2.4.3 字节对齐

为了加快计算机的取数速度，编译器默认对内存进行字节对齐。对结构体（包括类）进行字节对齐的原则是：

1）结构体变量的首地址能够被其最宽基本类型成员的大小所整除；

2）结构体每个成员相对于结构体首地址的偏移量（offset）都是成员大小的整数倍，如有需要编译器会在成员之间加上填充字节（internal adding）；

3）结构体的总大小为结构体最宽基本类型成员大小的整数倍，如有需要编译器会在最末一个成员之后加上填充字节（trailing padding）。

Cpp代码

struct SByte1
{
double d; // 偏移量0~7
char j; // 偏移量8
int a; // 偏移量12~15，由于9不能整除4，故先填充9~11
};
sizeof(SByte1); // = 16
struct SByte2
{
char j; // 偏移量0
double d; // 偏移量8~15，由于1不能整除8，故先填充1~7
int a; // 偏移量16~19
};
sizeof(SByte2); // = 24，为了凑成8的倍数，填充20~23

struct SByte1
{
	double d;    // 偏移量0~7
	char j;      // 偏移量8
	int a;       // 偏移量12~15，由于9不能整除4，故先填充9~11
}; 
sizeof(SByte1);  // = 16

struct SByte2
{      
    char j;      // 偏移量0
	double d;    // 偏移量8~15，由于1不能整除8，故先填充1~7
	int a;       // 偏移量16~19
}; 
sizeof(SByte2);  // = 24，为了凑成8的倍数，填充20~23

另外，可以通过#pragma pack(n)来设定变量以n字节对齐方式。

Cpp代码

#pragma pack(push) //保存对齐状态
#pragma pack(4) //设定为4字节对齐
class CByte
{
char c; //偏移量0
double d; //偏移量4~11，由于1不能整除4，故先填充1~3
int i; //偏移量12~15
};
#pragma pack(pop) //恢复对齐状态
sizeof(CByte); // = 16

#pragma pack(push) //保存对齐状态
#pragma pack(4)    //设定为4字节对齐
class CByte
{
	char c;        //偏移量0
	double d;      //偏移量4~11，由于1不能整除4，故先填充1~3
	int i;         //偏移量12~15
};
#pragma pack(pop)  //恢复对齐状态
sizeof(CByte); // = 16

2.4.4 位域

有些信息在存储时，并不需要占用一个完整的字节，而只需占几个或一个二进制位。例如在存放一个开关量时，只有0和1 两种状态，用一位二进位即可。为了节省存储空间，并使处理简便，C语言又提供了一种数据结构，称为“位域”或“位段”。所谓“位域”是把一个字节中的二进位划分为几个不同的区域，并说明每个区域的位数。

2.4.4.1 位域以比特位作为单位，其长度不能大于一个字节。一个位域必须存储在同一个字节中，如一个字节所剩空间不够存放另一位域时，应从下一单元起存放该位域。

Cpp代码

struct SBit1
{
char a : 3;
char b : 4;
char c : 5;
};
sizeof(SBit1); // = (3+4+1+5+3) bits = 2 bytes

struct SBit1
{

    char a : 3;
    char b : 4;
    char c : 5;
};
sizeof(SBit1); // = (3+4+1+5+3) bits = 2 bytes

SBit1：| a × 3+ b × 4 + # × 1 | c × 5 + # × 3 |

2.4.4.2 使用空域可以有意使某位域从下一单元开始，但是空域不能使用。

Cpp代码

struct SBit2
{
char a : 3;
char : 0; // 空域
char b : 4;
char c : 5;
};
sizeof(SBit2); // = (3+4+1+5+3) bits = 3 bytes

struct SBit2
{
    char a : 3;
    char   : 0;   // 空域
    char b : 4;
    char c : 5;
};
sizeof(SBit2); // = (3+4+1+5+3) bits = 3 bytes

SBit2：| a ×3 + # × 5 | b × 4 + # × 4 | c × 5 + # × 3 |

2.4.4.3 如果相邻的位域字段的类型不同，则各编译器的具体实现有差异，VC6采取不压缩方式，Dev-C++采取压缩方式。

Cpp代码

struct SBit3
{
char a : 3;
short b : 4;
char c : 5;
};
sizeof(SBit3); // = 6 bytes，由于相邻位域类型不同，在VC6中其sizeof为6，在Dev-C++中为2。

struct SBit3
{
    char  a : 3;
    short b : 4;
    char  c : 5;
};
sizeof(SBit3); // = 6 bytes，由于相邻位域类型不同，在VC6中其sizeof为6，在Dev-C++中为2。

SBit3（不压缩）：| a ×3 | # ×8 |b × 4 + # ×4 | # ×8 | c ×5 + # ×3 | # ×8 |

SBit3（压缩）：| a×3 + b ×4 + # ×1 | c ×5 + # ×3 |

2.4.4.4 如果位域字段之间穿插着非位域字段，则不进行压缩。

Cpp代码

struct SBit4
{
int a : 3;
int b : 4;
int c;
};
sizeof(SBit4); // = 8 bytes

struct SBit4
{
    int a : 3;
    int b : 4;
    int c;
};
sizeof(SBit4); // = 8 bytes

SBit4：| a×3 + b ×4 + # ×1 | # ×8 | # ×8 | # ×8 | c ×8 | c ×8 | c ×8 | c ×8 |

2.4.4.5 整个结构体的总大小为最宽基本类型成员大小的整数倍。

Cpp代码

struct SBit5
{
int a : 3;
int b;
int c : 5;
};
sizeof(SBit5); // = 12 bytes

struct SBit5
{
    int a : 3;
    int b;
    int c : 5;
};
sizeof(SBit5); // = 12 bytes

SBit5：| a×3 + # ×5 | # ×8 | # ×8 | # ×8 | b ×8 | b ×8 | b ×8 | b ×8 | c ×5 + # ×3 | # ×8 | # ×8 | # ×8 |

2.5 联合

联合表示若干数据成员取其一，故以叠加方式分配内存，所占字节数为最大数据成员所占的字节数。

Cpp代码

union U
{
int i;
char c;
double d;
};
sizeof(U); // = Max(sizeof(i), sizeof(c), sizeof(d)) = sizeof(d) = 8

posted @ 2012-07-10 18:24 hktkhhhh 阅读(2023) 评论(0) 收藏举报

刷新页面返回顶部

hktkhhhh

深入理解计算机各种类型大小（sizeof）

1. 用法

1.1 sizeof和new、delete等一样，是关键字，不是函数或者宏。

1.2 sizeof返回内存中分配的字节数，它和操作系统的位数有关。例如在常见的32位系统中，int类型占4个字节；但是在16位系统中，int类型占2个字节。

1.3 sizeof的参数可以是类型，也可以是变量，还可以是常量。对于相同类型，以上3中形式参数的sizeof返回值相同。

1.4 C99标准规定，函数、不能确定类型的表达式以及位域（bit-field）成员不能被计算s izeof值，即下面这些写法都是错误的。

1.5 sizeof在编译阶段处理。由于sizeof不能被编译成机器码，所以sizeof的参数不能被编译，而是被替换成类型。

2. 在32位系统中不同类型的内存分配

2.1 基本类型

2.2 指针

指针在32位系统中占4个字节。

2.3 数组

2.3.1 数组的sizeof返回整个数组所占的字节数，即（数组元素个数×每个元素所占字节）。

2.3.2 常量字符串与字符数组的内存分配方式相同。

2.3.3 数组和指针所占的字节数不同，应注意区分。

2.3.4 函数形式参数中的数组会蜕变为指针，原因是数组参数“传址调用”，调用者只需将实参的地址传递过去。有一种情况例外，那就是参数是指向数组的指针。

2.4. 类和结构体的内存分配。

2.4.1 空类或空结构体占一个字节。

2.4.2 非空类和结构体所占字节为所有成员占字节的和，但是不包括成员函数和静态成员所占的空间。

2.4.3 字节对齐

为了加快计算机的取数速度，编译器默认对内存进行字节对齐。对结构体（包括类）进行字节对齐的原则是：

另外，可以通过#pragma pack(n)来设定变量以n字节对齐方式。

2.4.4 位域

2.4.4.1 位域以比特位作为单位，其长度不能大于一个字节。一个位域必须存储在同一个字节中，如一个字节所剩空间不够存放另一位域时，应从下一单元起存放该位域。

2.4.4.2 使用空域可以有意使某位域从下一单元开始，但是空域不能使用。

2.4.4.3 如果相邻的位域字段的类型不同，则各编译器的具体实现有差异，VC6采取不压缩方式，Dev-C++采取压缩方式。

2.4.4.4 如果位域字段之间穿插着非位域字段，则不进行压缩。

2.4.4.5 整个结构体的总大小为最宽基本类型成员大小的整数倍。

2.5 联合

联合表示若干数据成员取其一，故以叠加方式分配内存，所占字节数为最大数据成员所占的字节数。

公告

1.4 C99标准规定，函数、不能确定类型的表达式以及位域（bit-field）成员不能被计算s
izeof值，即下面这些写法都是错误的。