Char ,Unsigned Char
char 与 unsigned char是两个不同的数据类型, 取值范围完全相同,都是二进制的00000000-11111111, 也就是十六进制的00-FF. 长度都是1字节。
所谓取值范围不同的理解只是因为他们是两个不同的数据类型,所以转换成十进制才会有不同的结果。
正因为他们是两个不同的数据类型,所以C/C++对他们的处理方法也不同。除了转换成十进制会有不同的结果以外,涉及到C/C++编程的还有以下注意的地方:
1. 输出。不光是十进制输出,十六进制的输出也不一样。
2. 移位。对 char 执行算术移位,对 unsigned char 执行逻辑移位。
3. 比较。排序。对一级汉字可用strcmp()以unsigned char形式比较按汉语拼音排序,说明成char则会出现比较错误。
试看此程序:
int main()
{
char x=0x80;
unsigned char y = 0x80;
unsigned char z[]="你好";
printf("x=%d, HEX=%2X, (x>>1)=%d, HEX=%2X.\n", x, x, x>>1, x>>1);
printf("y=%d, HEX=%2X, (y>>1)=%d, HEX=%2X.\n", y, y, y>>1, y>>1);
printf("%s =", z);
for (x=0; x<4; ++x) printf(" %02X", z[x]);
return 0;
}
结果是:
x=-128, HEX=FFFFFF80, (x>>1)=-64, HEX=FFFFFFC0.
y=128, HEX=80, (y>>1)=64, HEX=40.
你好 = C4 E3 BA C3
所谓取值范围不同的理解只是因为他们是两个不同的数据类型,所以转换成十进制才会有不同的结果。
正因为他们是两个不同的数据类型,所以C/C++对他们的处理方法也不同。除了转换成十进制会有不同的结果以外,涉及到C/C++编程的还有以下注意的地方:
1. 输出。不光是十进制输出,十六进制的输出也不一样。
2. 移位。对 char 执行算术移位,对 unsigned char 执行逻辑移位。
3. 比较。排序。对一级汉字可用strcmp()以unsigned char形式比较按汉语拼音排序,说明成char则会出现比较错误。
试看此程序:
int main()
{
char x=0x80;
unsigned char y = 0x80;
unsigned char z[]="你好";
printf("x=%d, HEX=%2X, (x>>1)=%d, HEX=%2X.\n", x, x, x>>1, x>>1);
printf("y=%d, HEX=%2X, (y>>1)=%d, HEX=%2X.\n", y, y, y>>1, y>>1);
printf("%s =", z);
for (x=0; x<4; ++x) printf(" %02X", z[x]);
return 0;
}
结果是:
x=-128, HEX=FFFFFF80, (x>>1)=-64, HEX=FFFFFFC0.
y=128, HEX=80, (y>>1)=64, HEX=40.
你好 = C4 E3 BA C3
不只是输出结果不同, 尤其注意右移位,char 0x80 右移1位是 0xC0, unsigned char 0x80 右移1位是 0x40.
与此相关的一个面试题目是:
#include <iostream>
using namespace std;
void char2Hex(char c ) // 将字符以16进制表示
{
unsigned char ch,cl;
if(!(c & 0x80))
{
ch = c/0x10 + '0'; if( ch > '9' )
ch += ('A'-'9'-1);
cl = c%0x10 + '0'; if( cl > '9' )
cl += ('A'-'9'-1);
std::cout << ch << cl << ' ';
}
else
{
ch=c;
cout<<hex;
cout<<(int)ch<<' ';
}
}
void main()
{
char str[] = "I love 中国";
for( size_t i=0; i <strlen(str); ++i )
char2Hex( str[i] );
cout << endl;
}
using namespace std;
void char2Hex(char c ) // 将字符以16进制表示
{
unsigned char ch,cl;
if(!(c & 0x80))
{
ch = c/0x10 + '0'; if( ch > '9' )
ch += ('A'-'9'-1);
cl = c%0x10 + '0'; if( cl > '9' )
cl += ('A'-'9'-1);
std::cout << ch << cl << ' ';
}
else
{
ch=c;
cout<<hex;
cout<<(int)ch<<' ';
}
}
void main()
{
char str[] = "I love 中国";
for( size_t i=0; i <strlen(str); ++i )
char2Hex( str[i] );
cout << endl;
}

浙公网安备 33010602011771号