'\ddd'转义字符与八进制转换
所有的ASCII码都可以用“\”加数字(一般是8进制数字)来表示。而C中定义了一些字母前加"\"来表示常见的那些不能显示的ASCII字符,如\0,\t,\n等,就称为转义字符,因为后面的字符,都不是它本来的ASCII字符意思了。
——以上来自百度百科转义字符
直接看代码吧
char c1 = '\012';
char c2 = '\0123';
char c3 = '\0a12';
printf("%c,%c,%c\n",c1,c2,c3);
猜一猜,输出结果是什么?
……
……
……
公布答案:
在屏幕上实际输出了一个换行符 '\n' 一个字符 '3' 一个字符 '2'
\ddd
1到3位八进制数所代表的任意字符 三位八进制
是不是有点懵啊,不是说好的八进制吗,第一个 '\n' 的ascall码为10,刚好等于八进制的 '\012'
为什么后两个算出来后的值却是 3 和 2 啊?
下面在看一组测试用例你就懂了:
char c4 = '\007';
//char c4_1 = '\400';
char c4_2 = '\377';
char c4_3 = '\0377';
char c4_4 = '\03a7';
char c4_4 = '\a07';
老规矩,猜一猜,输出结果是什么?
……
……
……
是不是还是有点懵啊,别急,再看一张图
下面揭晓谜题,其实 \ddd 最多只支持三位数字,并且三位数字也不是任意的,一旦大于等于八进制数 '/400 '(十进制256=8进制400)就超过了ascall码的范围,编译器就会报错。另外大于三位,或者遇到非八进制数字时则转换结束,直接取末尾数字。所以现在再回头去看看是不是发现很简单吧。
以免我的表述不够准确,在举个小栗子:
- char ch = '\062' ch等于字符 ‘2‘ ,十进制ascall码值为50,
该式把十进制的ascall对应值的字符赋值给ch 等同于ch = '2'; 或ch=50;
- char ch = '\0012' ch等于字符 '2' ,十进制ascall码值为50,
过长,进行截断。该式截取最后一个2,以字符'2'的形式 赋值给ch 等同于ch = '2'; 或ch=50;
- char ch = '\009' ch等于字符 '9' ,十进制ascall码值为57,
该式把十进制的ascall对应值的字符赋值给ch 等同于ch = '9'; 或ch=57;
- char ch = '\0009' ch等于字符 '9' ,十进制ascall码值为57,
过长,进行截断。该式截取最后的9 ,以字符'9'的形式赋值给ch 等同于ch = '9'; 或ch=57;
总结:
使用 '\ddd' 方法赋值实际上是将八进制数字通过转义字符 '\' 赋值为ascii表中对应的字符。
char ch = '\60'; char ch = 48; char ch = '0'; 这三个语句是一样的效果。
只不过第一种是通过八进制的方式,第二种是通过10进制的方式,三种是通过字符的方式。
ascii表:
另外需要注意的是,使用字符赋值的时候,单引号‘’通常只写一个字符。因为char类型只占一个字节,如果写入字符过多,也只会取其中一个字符。
如:char ch = 'ABC'; 最终ch的值为'C'。
仅测试在我本地计算机,和Linux服务器都将此语句执行后,ch保存为'C'。由此猜测它们都是以小端的方式存储数据。
何谓小端:如对于一个12345的整数,左边的1是‘万’位也就是我们所说的高位,而个为的5就是低位。
小端顾名思义就是先存储小的那一端。如对于12345我们存储的时候 54321 这样存储。大端存储方式自然相反。
而,对于计算机来说,每8位二进制为一字节,也就是2个16进制数,而我们使用小端存储 ch 时就做了这样的事。
并且,由于ch是char类型,只能容纳一个字节的数据,因此ch最终的取值为十六进制数 0x43,也就是字符 'C'。
同样的,对于int类型也是一样的存储方式。