边界测试——让BUG现形
题目:写一个函数,输入一行字符,将此字符串中最长的单词输出。
#include <stdio.h>
#include <string.h>
int main()
{int alphabetic(char);
int longest(char []);
int i;
char line[100];
printf("input one line:\n");
gets(line);
printf("The longest word is:");
for(i=longest(line);alphabetic(line[i]);i++)
printf("%c",line[i]);
printf("\n");
return 0;
}
int alphabetic(char c)
{
if((c>='a'&&c<='z')||(c>='A'&&c<='z'))
return(1);
else
return(0);
}
int longest(char string[])
{int len=0,i,length=0,flag=1,place=0,point;
for(i=0;i<=strlen(string);i++)
if(alphabetic(string[i]))
if(flag)
{point=i;
flag=0;
}
else
len++;
else
{flag=1;
if(len>=length)
{length=len;
place=point;
len=0;
}
}
return(place);
}
运行结果:
input a line:
I am a student.
The longest word is : student
——————谭浩强 ,《C程序设计(第四版)学习辅导》,清华大学出版社,2010年7月,p82~84
题目要求“写一个函数,输入一行字符,将此字符串中最长的单词输出”,可是无论alphabetic()还是longest()函数都没有实现“输入一行字符,将此字符串中最长的单词输出”这个功能要求。疑惑很久,发现实现这个功能的函数居然是main()。这就难免让人贻笑大方了。因为按照常规的惯例,要求写一个函数实现某个功能,从来不是要求写main(),尽管不能说main()不是“一个函数”。然而如果是要求main()完成的事情,通常是作为一个完整的问题提出的,不会提出“写一个函数”这样的要求。如果硬要狡辩“写一个函数”也不排除是写main(),就牵强的近乎强词夺理了。不过设若真的有人如此嘴硬,你还真拿他没什么办法。
既然是不见棺材不掉泪,那就不妨继续往下看。
在代码中一眼瞄见了flag这个变量。经验表明,凡是有这个flag变量的代码,80%以上都是垃圾代码。道理很简单:首先,多数问题根本不需要设置这个别别扭扭标志变量,只有那些善于把自己的思维扭曲得如同烂麻花一样的人才喜欢时不时地祭出flag这个破烂的法宝。其次,即使需要设置标准变量,优秀的代码作者也不会使用这个含义模糊不清的名字作为标志变量名,而会用一个更贴切、意义更明确恰当更适合描述问题的名字。所以,一般来说,flag往往反映了代码的垃圾度。
对于垃圾代码,没必要进行过于细致的分析,只要指出错误即可。不要试图了解这种代码的思路,因为这种代码的思路本来就是错乱不堪的,就如同不要试图理解疯子的胡言乱语一样。不要试图修缮一座胡乱搭建起来的破烂不堪的危房,推倒重来才是明智的选择。
然而,找出程序的漏洞或错误,往往比完成程序要难得多。而且越是垃圾的代码越难查错,因为垃圾代码往往也不具备良好的可测试性。
但是对付这种可测试性极差的垃圾代码,有一些简单的办法往往非常容易奏效,比如边界检查。训练有素的程序员通常都特别注意边界,无论是写代码时还是检查代码时。因为他们知道这里非常容易出错,而且往往失之毫厘谬之千里。但垃圾代码的作者,由于代码是东拼西补、胡乱拼凑而成的,所以往往顾不上或考虑不到这些,因此垃圾代码很容易被“边界检查”这把小刀轻而易举地戳破。以alphabetic()函数为例,只要简单地考察一下其中if语句所要求的表达式——(c>='a'&&c<='z')||(c>='A'&&c<='z'),就不难发现c<='z'这个子表达式是c<='Z'之误。这样就充分说明原代码中存在着BUG。
顺便说一下,alphabetic()函数中的if-else语句用得非常愚蠢,因为(c>='a'&&c<='z') || (c>='A'&&c<='Z')这个表达式的值本身就只能为0或1,所以直接返回这个表达式的值就可以了。压根用不着脱裤子放屁地写一个if-else语句。
int alphabetic(char c) { return (c>='a'&&c<='z') || (c>='A'&&c<='Z'); }
或许,有人会认为这是一个简单的笔误或印刷错误,修正了这个错误原来的代码是正确的。那么好吧,下面改正这个错误后再来运用一次简单的边界测试。
由于问题要求输出一行字符中最长的单词,而一行字符中可能有0个单词、1个单词、2个单词……。注意,这里0个单词的情况就是一种边界情况,运行这个程序并输入0个单词(输入一行不含任何字母的字符,因为代码作者把连续的若干字母字符作为一个单词),后果居然是——运行时程序崩溃了。这个结果绝对可以充分说明原来的代码是错误的。
这个结果是如何产生的呢?只要在纸上走查一遍,就不难发现,输入一行不含任何字母的字符时,longest()函数中嵌套在for语句内部的if语句将毫无意义地反复执行
{flag=1;
if(len>=length)
{length=len;
place=point;
len=0;
}
}
部分,而其中的赋值给place的point却居然是一个不确定的垃圾值。
应该如何正确地给出这个问题的代码呢?正确解决问题的前提是正确地提出问题。原来问题的提法本身就有很多不正确或不严谨的地方。例如,“将此字符串中最长的单词输出”,这个要求本身就是似是而非很不明确的。比如,字符串中有两个单词长度相同且都长于其他单词,究竟应该输出这两个单词中的任何一个还是需要同时输出这两个单词?再有,要求函数“输入一行字符”也非常无聊。为了能正确地解决问题,有必要对原问题的错误要求进行如下更正:
写一个函数,输出字符串中的任一长度最长的单词。这里所谓的单词,是指不含空白字符的连续字符序列。
#include <stdio.h> void print_a_longestword ( const char [] ) ; int be_white ( const char ) ; int find_begin( char const [] , unsigned ) ; int find_end ( char const [] , unsigned ) ; void output ( char const [] , unsigned , unsigned ) ; int main( void ) { printf("%s中一最长单词为:",""); //测试"" print_a_longestword(""); printf("%s中一最长单词为:"," \n\t "); //测试" \n\t " print_a_longestword(" \n\t "); printf("%s中一最长单词为:"," abc "); //测试" abc " print_a_longestword(" abc "); printf("%s中一最长单词为:"," abc \tabcd "); //测试" abc \tabcd " print_a_longestword(" abc \tabcd "); return 0; } void output( char const str[] , unsigned from , unsigned to ) { while(from < to) putchar(str[from ++]); putchar('\n'); } int find_end ( const char str[] , unsigned from ) { while( str[from]!='\0' && ! be_white( str[from] ) ) from ++ ; return from ; } int find_begin ( const char str[] , unsigned from ) { while( be_white( str[from] ) ) from ++ ; return from ; } int be_white( const char c ) { return c == ' ' || c == '\t' || c == '\n' ; } void print_a_longestword ( char const line[] ) { unsigned site = 0U ; unsigned begin_longest , end_longest ; begin_longest = end_longest = site ; do{ int this_begin , this_end ; site = this_begin = find_begin ( line , site ) ;//单词开头 site = this_end = find_end ( line , site ) ;//单词结尾 if( ( this_end - this_begin ) > ( end_longest - begin_longest ) ){ begin_longest = this_begin ; end_longest = this_end ; } }while( line[ site ] != '\0') ; output( line , begin_longest , end_longest ); }