C/C++ 自动类型转换的陷阱
我们先来看一段实现KMP的代码:
1 void getNext(int * next,string str){ 2 int i=0,j=-1; 3 next[0]=-1; 4 while(i < str.length()-1){ 5 if(j==-1 || str[i]==str[j]){ 6 i++; 7 j++; 8 next[i]=j; 9 } 10 else{ 11 j=next[j]; 12 } 13 } 14 } 15 int KMPMatch(string buffer,string p){ 16 int next[100]; 17 getNext(next,p); 18 int i=0,j=0; 19 while(i < buffer.length() && j < p.length() ){ 20 if(j == -1 || buffer[i] == p[j]){ 21 i++; 22 j++; 23 } 24 else 25 j=next[j]; 26 } 27 if(j == p.length()) 28 return i-j; 29 else 30 return -1; 31 }
咋看之下似乎一切都没有问题,可是实际运行起来都是返回 -1!
debug看了下,每次当在 i=0,j=-1时,对于
while(i < buffer.length() && j < p.length() )
判定条件不成立,跳出while循环,直接执行27行的 if(j == p.length()) ?
再看看length函数的声明,返回类型是size_t !! 是一个无符号数!!
size_t length() const;
《C++ Primer》里面提示道:切勿混用带符号和无符号类型
如果表达式里面既有带符号类型又有无符号类型,当带符号类型取值为负时会出现异常结果,这是因为带符号数会自动转换成无符号数。
当有符号数 j 和无符号数 string::length()比较时,j被自动转换成无符号整数,j 直接被转换成了4294967295(在我的平台上,结果视你的机器的int所占位数而定)!!使得while循环直接跳出,返回错误的结果。
尽管有些编程铁则你看过,但是很快可能就忘了或者就无意识地违背这些原则,还是只有踩过才能记住这些坑。所以还是趁着工作前多编码,不怕犯错,最好是错得刻骨铭心,多总结。
附上C/C++类型自动转换规则:
1. 在表达式中,char 和 short 类型的值,无论有符号还是无符号,都会自动转换成 int 或者 unsigned int(如果 short 的大小和 int 一样,unsigned short 的表示范围就大于 int,在这种情况下,unsigned short 被转换成 unsigned int)。因为它们被转换成表示范围更大的类型,故而把这种转换称为“升级(promotion)”。
2. 按照从高到低的顺序给各种数据类型分等级,依次为:long double, double, float, unsigned long long, long long, unsigned long, long, unsigned int 和 int。这里有一个小小的例外,如果 long 和 int 大小相同,则 unsigned int 的等级应位于 long 之上。char 和 short 并没有出现于这个等级列表,是因为它们应该已经被升级成了 int 或者 unsigned int。
3. 在任何涉及两种数据类型的操作中,它们之间等级较低的类型会被转换成等级较高的类型。
4. 在赋值语句中,= 右边的值在赋予 = 左边的变量之前,首先要将右边的值的数据类型转换成左边变量的类型。也就是说,左边变量是什么数据类型,右边的值就要转换成什么数据类型的值。这个过程可能导致右边的值的类型升级,也可能导致其类型降级(demotion)。所谓“降级”,是指等级较高的类型被转换成等级较低的类型。
5. 作为参数传递给函数时,char 和 short 会被转换成 int,float 会被转换成 double。使用函数原型可以避免这种自动升级。