代码改变世界

从一道笔试题中看转义字符

2011-06-01 14:22  x_feng  阅读(814)  评论(0编辑  收藏  举报

题目如下:

char s[] = “\\123456\123456\t”;

printf(“%d\n”, strlen(s));

A 12     B 13    C 16   D 以上都不对

先不说结果如何,我们看看s[]在内存中的结构:

无标题

很清楚,char[13]数组大小为13,答案似乎是B,很不幸错了,strlen返回的长度不包括结尾空白符,答案为A 12。

‘\’为转义符,转义字符用反斜杠\后面跟一个字符或一个八进制或十六进制数表示。

下图为转义字符表:

无标题

char s[] = “\\123456\123456\t”;中的\\相对于一个字符\,\123中,1,2,3都满足8进制数,因此\123其实表示一个字符。那么我现在看看为什么内存中显示char s[7] = ‘S’,即\123的值为‘S’??

\ddd 斜杠后面跟三位八进制数,该三位八进制数的值即为对应的八进制ASCII码值。八进制123换算成十进制 = 1*8*8 + 2*8 + 3 = 83,由ASCII可以看出‘S’对于十进制83,八进制为123。

\x后面跟两位十六进制数,该两位十六进制数为对应字符的十六进制ASCII码值。

那么知道了上面的解答,下面一些情况看是怎么样的?

char s[] = “\123”;  //sizeof(s) = 2; strlen(s) = 1;ok
char s[] = “\192”;  //sizeof(s) = 4; strlen(s) = 3;因为9不是八进制数,所以\只对1起作用。ok?
char s[] = “\911”;  //sizeof(s) = 4; strlen(s) = 3;因为9不是八进制,所以\没有起到任何作用。ok?
char s[] = “\x12”;  //sizeof(s) = 2; strlen(s) = 1;x后面有两位十六进制数,\x12其实是一个字符。ok?
char s[] = “\x111” //这里编译器会报错:273对字符来说太大。这时编译器会傻傻的把\x后面所有的数字都看成十六进制的数:1*16*16 + 1*16 + 1 = 273,ASCII表最多只有255个字符(下表不全,还有扩展的ASCII),所以\x后面只能跟两个十六进制的数,除非?如下:

*这里有个小小的区别:\ddd 只计算后面3位八进制,而\x会把后面所有的位都计算!

char s[] = “\x011”;
char s[] = “\x00011”;这样不管前面有多少个0,strlen(s) 始终= 1。只要后面不连续出现3个大于0的数(当然编译器会编译报错)。
那么现在再来看看:
char s[] = “\\123456\0000123456\t”;
sizeof(s) = ?;         // 编译器会把\000,3位八进制数字做转义,即\000其实为一位,等于0,这样长度为:1+6+1+1+6+1+1 = 17
strlen(s) = ?;         // 当遇到\0时,strlen函数会认为字符串到了结尾,因此不再往下计算,所以strlen(s)只计算了“\\123456\0”这段长度,去掉结尾空白符号,返回7
如果是:
char s[] = “\\123456\0000123456\t\x0000aa”;
sizeof(s) = ?;  
strlen(s) = ?; 

(以上程序都在win32,vs2010下测试,不知道到其它环境会不会有区别,如果有,烦请告知,谢谢)

ASCII字符表:

20060922113734