C++中的枚举变量
至从C语言开始enum类型就被作为用户自定义分类有限集合常量的方法被引入到了语言当中,而且一度成为C++中定义编译期常量的唯一方法(后来在类中引入了静态整型常量)。
根据上面对enum类型的描述,有以下几个问题:
1.到底enum所定义出来的类型是一个什么样的类型呢?
2.作为一个用户自定义的类型其所占用的内存空间是多少呢?
3.使用enum类型是否真的能够起到有限集合常量的边界约束呢?
4.大家可能都知道enum类型和int类型具有隐示(自动)转换的规则,那么是否真的在任何地方都可以使用enum类型的变量来代替int类型的变量呢?
1. 到底enum所定义出来的类型是一个什么样的类型呢?
在C++中大家都知道仅仅有两种大的类型分类:POD类型(注(1))和类类型。
enum所定义的类型其实属于POD类型,也就是说它会参与到POD类型的隐示转换规则当中去,所以才会出现enum类型与int类型之间的隐示转换现象。
那么也就是说enum所定义的类型不具备名字空间限定能力(因为不属于类类型),其所定义的常量子具备和enum类型所在名字空间相同的可见性,由于自身没有名字限定能力,所以会出现名字冲突现象。
如:
struct CEType { enum EType1 { e1, e2 }; enum EType2 { e1, e2 }; };
上面的例子会出现e1、e2名字冲突编译时错误,原因就在于枚举子(e1、e2)是CEType名字空间中的名字,同样在引用该CEType中的枚举子时必须采用CEType::e1这样的方式进行,而不是CEType::EType1::e1来进行引用。
注(1)POD类型:
你可以将 POD 类型看作是一种来自外太空的用绿色保护层包装的数据类型,POD 意为“Plain Old Data”(译者:如果一定要译成中文,那就叫“彻头彻尾的老数据”怎么样!)这就是 POD 类型的含义。
其确切定义相当粗糙(参见 C++ ISO 标准),其基本意思是 POD 类型包含与 C 兼容的原始数据。
例如,结构和整型是 POD 类型,但带有构造函数或虚拟函数的类则不是。
POD 类型没有虚拟函数,基类,用户定义的构造函数,拷贝构造,赋值操作符或析构函数。
为了将 POD 类型概念化,你可以通过拷贝其比特来拷贝它们。此外, POD 类型可以是非初始化的。
2. 作为一个用户自定义的类型其所占用的内存空间是多少呢?
该问题就是sizeof( EType1 )等于多少的问题,是不是每一个用户自定义的枚举类型都具有相同的尺寸呢?
在大多数的32位编译器下(如:VC++、gcc等)一个枚举类型的尺寸其实就是一个sizeof( int )的大小,难道枚举类型的尺寸真的就应该是int类型的尺寸吗?
其实不是这样的,在C++标准文档(ISO14882)中并没有这样来定义,
标准中是这样说明的:“枚举类型的尺寸是以能够容纳最大枚举子的值的整数的尺寸”,
同时标准中也说明了:“枚举类型中的枚举子的值必须要能够用一个int类型表述”,
也就是说,枚举类型的尺寸不能够超过int类型的尺寸,但是是不是必须和int类型具有相同的尺寸呢?
上面的标准已经说得很清楚了,只要能够容纳最大的枚举子的值的整数就可以了,那么就是说可以是char、short和int。
例如:
enum EType1 { e1 = CHAR_MAX };
enum EType2 { e2 = SHRT_MAX };
enum EType3 { e3 = INT_MAX };
上面的三个枚举类型分别可以用char、short、int的内存空间进行表示,也就是:
sizeof( EType1 ) == sizeof( char );
sizeof( EType2 ) == sizeof( short );
sizeof( EType3 ) == sizeof( int );
那为什么在32位的编译器下都会将上面三个枚举类型的尺寸编译成int类型的尺寸呢?
主要是从32位数据内存对其方面的要求进行考虑的,在某些计算机硬件环境下具有对齐的强制性要求(如:sun SPARC),
有些则是因为采用一个完整的32位字长CPU处理效率非常高的原因(如:IA32)。
所以不可以简单的假设枚举类型的尺寸就是int类型的尺寸,说不定会遇到一个编译器为了节约内存而采用上面的处理策略。
3. 使用enum类型是否真的能够起到有限集合常量的边界约束呢?
首先看一下下面这个例子:
enum EType { e1 = 0, e2 }; void func1( EType e ) { if ( e == e1 ) { // do something } // do something because e != e1 must e == e2 } void func2( EType e ) { if ( e == e1 ) { // do something } else if ( e == e2 ) { // do something } } func1( static_cast<EType>( 2 ) ); func2( static_cast<EType>( -1 ) );
上面的代码应该很清楚的说明了这样一种异常的情况了,在使用一个操出范围的整型值调用func1函数时会导致函数采取不该采取的行为,而第二个函数可能会好一些他仅仅是忽略了超出范围的值。
这就说明枚举所定义的类型并不是一个真正强类型的有限常量集合,这样一种条件下和将上述的两个函数参数声明成为整数类型没有任何差异。所以以后要注意标准定义中枚举类型的陷阱。
(其实只有类类型才是真正的强类型)
4. 是否真的在任何地方都可以使用enum类型的变量来代替int类型的变量呢?
通过上面的讨论,其实枚举类型的变量和整型变量具有了太多的一致性和可互换性,那么是不是在每一个可以使用int类型的地方都可以很好的用枚举类型来替代呢?
其实也不是这样的,毕竟枚举类型是一个在编译时可区分的类型,
同时第2点的分析枚举类型不一定和int类型具有相同的尺寸,这两个差异就决定了在某些场合是不可以使用枚举类型来代替int类型的。
如:
// 第一种情况: enum EType { e1 = 0, e2, e3 }; EType val; std::cin >> val; // 第二种情况: enum EType { e1 = 0, e2, e3 }; EType val; std::scanf( "%d", &val );
上面的两种情况看是基本上属于同一种类型的问题,其实不然。第一种情况会导致编译时错误,会因为std::cin没有定义对应的枚举类型的重载>>运算符而出错,这就说明枚举类型是一种独立和鉴别的类型;
而第二种情况不会有任何编译时问题,但是可能会导致scanf函数栈被破坏而使得程序运行非法,为什么会这样呢? 上面已经分析过了枚举类型变量的尺寸不一定和int类型相同,这样一来我们采用%d就是说将枚举类型变量val当作4字节的int变量来看待并进行参数压栈,而在某些编译器下sizeof( val )等于1字节,这样scanf函数就会将val变量地址中的后续的三字节地址也压入栈中,并对其进行赋值,也许val变量后续的三个字节的地址没有特殊含义可以被改写(比如是字节对齐的空地址空间),可能会认为他不会出现错误,其实不然,在scanf函数调用结束后会进行栈清理,这样一来会导致scanf函数清理了过多的地址空间,从而破坏了外围函数的栈指针的指向,从而必然会导致程序运行时错误。(个人理解:如果val变量后续的三个字节的地址空间不可以被改写,那么当scanf函数将val变量后续三个地址压入栈,在完成了操作之后,scanf函数调用结束进行栈清理,这时候就会把后续的三个字节地址清理,而此时是不应该清理后续地址的。)
由上面的说明枚举类型有那么多的缺点,那我们怎样才能够有一个类型安全的枚举类型呢?实际上,在最新的 C++0x 标准草案中有关于枚举作用域问题的提案,但最终的解决方案会是怎样的就无法未卜先知了,毕竟对于象 C++ 这样使用广泛的语言来说,任何特性的增删和修改都必须十分小心谨慎。
当然,我们可以使用一些迂回的方法来解决这个问题(C++ 总是能给我们很多惊喜和意外)。
例如,我们可以把枚举值放在一个结构里,并使用运算符重载来逼近枚举的特性:
struct FileAccess { enum __Enum { Read = 0x1, Write = 0x2 }; __Enum _value; // 枚举值 FileAccess(int value = 0) : _value((__Enum)value) {} FileAccess& operator=(int value) { this->_value = (__Enum)value; return *this; } operator int() const { return this->_value; } };
我们现在可以按照希望的方式使用这个枚举类型:
FileAccess access = FileAccess::Read;
并且,因为我们提供了到 int 类型的转换运算符,因此在需要 int 的地方都可以使用它,例如 switch 语句:
switch (access) { case FileAccess::Read: break; case FileAccess::Write: break; }
当然我们不愿意每次都手工编写这样的结构。通过使用宏,我们可以很容易做到这一点:
#define DECLARE_ENUM(E) \ struct E \ { \ public: \ E(int value = 0) : _value((__Enum)value) { \ } \ E& operator=(int value) { \ this->_value = (__Enum)value; \ return *this; \ } \ operator int() const { \ return this->_value; \ } \ \ enum __Enum { #define END_ENUM() \ }; \ \ private: \ __Enum _value; \ };
我们现在可以按如下的方式定义前面的枚举,并且不比直接写 enum 复杂多少。
DECLARE_ENUM(FileAccess) Read = 0x1, Write = 0x2, END_ENUM() DECLARE_ENUM(FileShare) Read = 0x1, Write = 0x2, END_ENUM()
【以上转自】http://www.cppblog.com/Randy/archive/2009/03/23/77612.aspx
----------------------------------------------------------------------------------------------------------
【以下转自】http://www.cnblogs.com/hicjiajia/archive/2009/09/27/1574957.html
参考文献:
[1]C++程序设计语言(特别版), 裘宗燕译, 机械工业出版社
[2]C++ Primer (3rd Ed.), S.B. Lippman and J. Lajoie, 人民邮电出版社
1、枚举enum的用途浅例
写程序时,我们常常需要为某个对象关联一组可选alternative属性.例如,学生的成绩分A,B,C,D等,天气分sunny, cloudy, rainy等等。
更常见的,打开一个文件可能有三种状态:input, output和append. 典型做法是,对应定义3个常数,即:
const int input = 1; const int output = 2; const int append = 3;
然后,调用以下函数:
bool open_file(string file_name, int open_mode);
比如,
open_file("Phenix_and_the_Crane", append);
这种做法比较简单,但存在许多缺点,主要的一点就是无法限制传递给open_file函数的第2个参数的取值范围,只要传递int类型的值都是合法的。(当然,这样的情况下的应对措施就是在open_file函数内部判断第二个参数的取值,只有在1,2,3范围内才处理。)
使用枚举能在一定程度上减轻这种尴尬(注1),它不但能实现类似于之前定义三个常量的功能,还能够将这三个值组合起来成为独一无二的组。例如:
enum open_modes {input = 1, output, append};
以上定义了open_modes为枚举类型enumeration type。每一个命名了的枚举都是唯一的类型,是一个类型标示器type specifier。例如,我们可以重新写一个open_file函数:
bool open_file(string file_name, open_modes om);
在open_modes枚举中,input, output, append称为枚举子enumerator, 它们限定了open_modes定义的对象的取值范围。这个时候,调用open_file函数和之前的方法还是一模一样:
open_file("Phenix_and_the_Crane", append);
但是,如果传递给open_file的第二个参数不是open_modes枚举类型值的话(注1),那么编译器就会识别出错误;就算该参数取值等价于input, output, append中的某个,
也一样会出错哦!例如:
open_file("Phenix_and_the_Crane", 1);
2、枚举的定义
一个枚举是一个类型,可以保存一组由用户刻画的值。定义之类,枚举的使用很像一个整数类型。
枚举的定义具有以下形式,即以关键词enum开头,接着一个可选的枚举名,下来是由大括号{}包含着一个由逗号分隔的枚举子列表enumerators list:
enum [enumeration name] {enumerator1[=value1], enumerator2[=value2], ...};
3、枚举子的类型和取值
枚举子的类型就是它所在的那个枚举,例如前面说到的open_modes枚举中,input,output和append等枚举子的类型都是open_modes。这种做法,其实是为了赋予用户和编译器一些有关该变量拟议中的用途的提示。
默认下,第一个枚举子被赋值0,接下来的枚举子取值是前面一个枚举子的取值+1,例如:
enum weather {sunny, cloudy, rainy, windy};
其中
sunny == 0, cloudy == 1, rainy == 2, windy == 3;
以上是默认情况,有时候我们希望显式地指定某个枚举子的值,那么会出现什么情况呢?看看:
enum some_fruit {apple = 3, orange, banana = 4, bear};
好了,apple == 3, banana == 4; 那么orange和bear呢?记得前面说过一句,默认下”接下来的枚举子取值是前面一个枚举子的取值+1“。既然这两个枚举子没有显式赋值,那么就按照默认规则办事,所以 orange == 4, bear == 5.
从这个例子也可以看出,同一枚举中枚举子的取值不需要唯一。这样有什么用处呢?下面是个简单的例子:
enum some_big_cities { Guangzhou = 4, Shenzhen = 4, Hongkong = 4, Shanghai = 2, Beijing = 3, Chongqi = 3 };
以上简单地按区域,将五个城市按照华南(4),华东(2), 华北(3)的几个城市分类了。
4、枚举变量的定义、初始化和赋值
既然每个枚举都是一个类型,那么由这个类型自然可以声明变量,例如,由前面定义的some_big_cities:
some_big_cities where_I_am;
需要注意的是,在声明where_I_am时没有初始化,如果这时打印where_I_am的值:
enum some_big_cities { Guangzhou = 4, Shenzhen = 4, Hongkong = 4, Shanghai = 2, Beijing = 3, Chongqi = 5
}; int main(void) { some_big_cities wh; cout<<"the value is: "<<wh<<endl; return 0; }
输出将是the value is: 1. 然而,如果声明wh为全局变量,则另一种情况:
enum some_big_cities {
Guangzhou = 1,
Shenzhen = 1,
Hongkong = 1, Shanghai = 2,
Beijing = 3,
Chongqi = 5
}; some_big_cities wh; int main(void) { cout<<"the value is: "<<wh<<endl; return 0; }
输出将是the value is: 0;
以上结果是在Visual C++ 2005 Express中得到,不知道其它编译器情况如何,也不知为什么得到这样的结果。下来再找找资料。
定义一个枚举变量时,可以给它初始化,例如:
some_big_cities wh = Guangzhou;
注意等号右边只能取枚举子中的某一个;特别地,以Guangzhou为例,虽然Guangzhou==4, 但以下初始化是出错的:
some_big_cities wh = 4;
Visual C++ 2005编译器提示:
error C2440: 'initializing' : cannot convert from 'int' to 'some_big_cities'
可见,不能直接地把一个整型赋值给一个枚举变量,因为枚举和整型是不同类型的,除非显式转换。关于枚举与整型的关系,后面再讲。
除了初始化,枚举变量也有赋值运算:
some_big_cities wh; wh = Guangzhou; wh = Shanghai;
或者
some_big_cities wh1 = Guangzhou; some_big_cities wh2 = Shanghai; wh2 = wh1;
5、枚举的取值范围
如果某个枚举中所有枚举子的值均非负,该枚举的表示范围就是[0:2^k-1],其中2^k是能使所有枚举子都位于此范围内的最小的2的幂;如果存在负的枚举值,该枚举的取值范围就是[-2^k,2^k-1].例如:
enum e1 {dark, light}; //范围0:1 enum e3 {min = -10, max = 1000}; //范围-1024:1023
6、枚举与整型的关系
整型值只能显式地转换成一个枚举值,但是,如果转换的结果位于该枚举取值范围之外,则结果是无定义的。
enum e1 {dark = 1, light = 10}; e1 VAR1 = e1(50); //无定义 e1 VAR2 = e1(3); //编译通过
在这里也说明了不允许隐式地从整型转换到枚举的原因,因为大部分整型值在特定的枚举里没有对应的表示。
至于枚举可以当作特定的整型数来用的例子,从open_modes可以体会。
7、自定义运算符
枚举是用户自定义类型,所以在用户可以为它定义自身的操作,例如++或者<<等。但是,在没有定义之前,不能因为枚举像整型就可以默认使用,例如:
enum SomeCities { zhanjiang, Maoming, Yangjiang, Jiangmen, Zhongshan }; SomeCities oneCity; for (oneCity = zhanjiang; oneCity != Zhongshan; ++oneCity) { cout<<oneCity<<endl; }
以上的++OneCity是没有定义的,在Visual C++ 6 编译下得到如下错误:
error C2675: unary '++' : 'enum main::SomeCities' does not define this operator or a conversion to a type acceptable to the predefined operator
8、Sizeof
一个枚举类型的sizeof就是某个能够容纳其范围的整型的sizeof, 而且不会大于sizeof(int), 除非某个枚举子的值不能用int或者unsigned int来表示。
在32位机器中,sizeof(int)一般等于4。前面介绍的所有枚举,例如,
enum SomeCities { zhanjiang, Maoming, Yangjiang, Jiangmen, Zhongshan };
计算其sizeof, 可能是1,也可能是是4。在我的intel E2160双核、32位机器中,得到4。
-----------------------------------------------------------------------------------
[注1, Begin]
由于通过将整型数显式转换就可能得到对应枚举类型的值,所以声明一个枚举来达到限制传递给函数的参数取值范围还是力不从心的,以下是一个例子:
enum SomeCities { zhanjiang=1, //1 Maoming, //2 Yangjiang, //3 Jiangmen, //4 Zhongshan = 1000 //1000 }; void printEnum(SomeCities sc) { cout<<sc<<endl; } int main(void) { SomeCities oneCity = SomeCities(50); //将50通过显式转换,为oneCity赋值 printEnum(oneCity); //在VC++ 6 编译器下得到50输出 return 0; }
以上例子说明,虽然SomeCities的定义里没有赋值为50的枚举值,但是,由于50在该枚举的取值范围内,所以通过显式声明得到一个有定义的枚举值,从而成功传递给printEnum函数。
[注1, End]