垃圾“程序是怎样练成的”——关于《C程序设计伴侣》第A章（五）

前文链接：http://www.cnblogs.com/pmer/archive/2012/12/15/2819274.html

【样本】

// 表示文件的结构体
typedef struct _txtfile
{
    char name[128];         // 文件名
    char text[1024*128];    // 文件的文本内容
    word* list;                // 保存单词的链表
    int total;                 // 单词总数
    float correlation;        // 关键词在文件中的词频
} txtfile;

　　　　——陈良乔，《C程序设计伴侣》，人民邮电出版社，2012年10月，p283

【评析】

　　“将词频添加到txtfile结构体中”是个愚蠢的想法，因为后面要根据词频进行排序，而txtfile中text成员是个极其庞大、笨重的char [1024*128]类型的数据对象。这就跟让一群人抱着水缸但却让他们按的个头高低排好队一样。

【样本】

　　　　——陈良乔，《C程序设计伴侣》，人民邮电出版社，2012年10月，p283

【评析】

　　数据结构反反复复一点谱都没有，居然不以为耻反以为荣。

　　看到“对于txtfile结构体的不断扩展，也反映了C语言面向结构程序设计中的‘逐步求精’的过程”这句话，任何懂得编程的人恐怕都会产生一种扔臭鸡蛋的冲动。但是这本书的阅读对象是并不懂得编程小朋友。悲夫？！

【样本】

// 计算词频模块的实现
// 参数files和count是保存txtfile结构体的数组指针和元素个数，
// keyword是要计算词频的关键词
void countkeyword(txtfile* files,int count,char* keyword)
{
    // 利用for循环，计算关键词在每一个文件中的词频
    for(int i = 0; i < count;++i)
    {
        // 在当前文件中查找关键词结点
        word* keynode = findnode(files[i].list,keyword);
        // 如果找到结点，则计算词频
        if(NULL != keynode)
        {
            // 利用单词的个数除以文件的单词总数计算词频
            files[i].correlation = keynode->count/(float)files[i].total;
        }
        else // 如果没有找到，词频为0
        {
            files[i].correlation = 0.0f;
        }
    }
}

　　——陈良乔，《C程序设计伴侣》，人民邮电出版社，2012年10月，p284

【评析】

　　本想这回可以不用说什么了。可一不小心看到了第二行注释中的“参数files和count是保存txtfile结构体的数组指针和元素个数”。“数组指针”不知所云。

【样本】

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <ctype.h>

//...
int main()
{
    // 文件读取以及数据预处理…

    // 无限循环，提供用户查询交互
    while(true)
    {
        puts("please input the keyword:");
        char keyword[30] = "";
        // 获取用户输入的关键词
        scanf("%s",keyword);
        // 如果用户输入的是“#”，则表示查询结束退出循环
        if(0 == strcmp(keyword,"#"))
            break;
          
        // 计算用户输入的关键词在各个文件中的词频
        countkeyword(files,filecount,keyword);
    }

    return 0;
}

　　——陈良乔，《C程序设计伴侣》，人民邮电出版社，2012年10月，p284~285

【评析】

　　“我们还需要在主函数中构造一个无限循环，让用户输入关键词”是奇葩。因为最初问题的要求是“现在要求输入一个关键词”。
　　自底向上地写代码最终往往得到的就是这么个效果：本来说是要画美人的，结果画成了张飞。
　　代码中

　　　　char keyword[30]="";

中的初始化多余，30是MagicNumber。

　　　　scanf("%s",keyword);

中存在危险的漏洞。这句话应该写为

scanf("30%s",keyword);

　　　文雅一点的写法是

#define MAX_LEN 30
#define S_(X) #X
#define S(X) S_(X)
 
scanf(S(MAX_LEN )"%s",keyword);<br>

 　　　　 if(0 == strcmp(keyword,"#"))
 　　　　　　break;

也是随心所欲的胡写，因为在最初的要求中根本就没这一条。

　　　　countkeyword(files,filecount,keyword);

这里的filecount和files没有关系，非常滑稽。
　　这条语句应该写为

countkeyword(files,sizeof files/sizeof *files,keyword);

【样本】

#include <math.h>
// …
// 比较规则函数
int cmp(const void* a,const void* b)
{
    // 将void*类型的参数转换为实际的txtfile*类型
    const txtfile* file1 = (txtfile*)a;
    const txtfile* file2 = (txtfile*)b;

    // 比较txtfile结构体的词频
    if(fabs(file1->correlation - file2->correlation) < 0.001)
    {
        return 0;
    }
    else if(file1->correlation > file2->correlation)
    {
        return 1;
    }
    else
    {
        return -1;
    }
}

// 文件排序模块的实现
void sortfiles(txtfile* files,int count)
{
    // 调用qsort()函数对数组进行排序
    qsort(files,count,sizeof(txtfile),cmp);    
}


// 数据输出模块的实现
// 参数files和count是保存txtfile结构体数据的数组，
// keyword是本次查询的关键词
void printfiles(txtfile* files,int count,char* keyword)
{
    // 输出本次查询的关键词
    printf("the keyword is \"%s\"\n",keyword);
    
    // 输出这个关键词在各个文件的词频
    puts("the correlations are ");
    for(int i = 0; i < count;++i)
    {
        printf("%s %.4f\n",files[i].name,files[i].correlation);     
    }
}

　　——陈良乔，《C程序设计伴侣》，人民邮电出版社，2012年10月，p284

【评析】

　　“根据问题的要求，我们需要根据各个文件的词频大小，对保存在数组中的txtfile文件结构体进行排序”这个想法很愚蠢，因为问题的要求并非如此，而且只需要根据词频对文件名排序就可以了，然而txtfile（不知道啥叫“txtfile文件结构体”）其他部分一同参与排序简直是吃饱了撑的。

　　代码部分：

　　cmp()函数形参名称很垃圾。

if(fabs(file1->correlation - file2->correlation) < 0.001)

　　这样的写法是食古不化，不仅毫无必要，而且弄出了一个MagicNumber 0.001。这里其实可以直接写

if( file1->correlation == file2->correlation )

　　另外这里的结构也可以写得更简单些

if( file1->correlation == file2->correlation )
{
 return 0;
}
if(file1->correlation > file2->correlation)
{
 return 1;
}
return -1;

　　sortfiles()函数像没用的裹脚布一样包在了qsort()上，使得qsort()的cmp实参变得不明不白。应该直接调用qsort()函数。

【样本】

    while(true)
    {
        // 输入关键词…
        // 计算关键词在各个文件中的词频
        countkeyword(files,filecount,keyword);

        // 按照关键词在各个文件中的词频，对文件进行排序
        sortfiles(files,filecount);
    }

　　——陈良乔，《C程序设计伴侣》，人民邮电出版社，2012年10月，p286

【评析】

　　非但笨拙，而且脱离了问题的要求。filecount和files毫无关联的错误同前，不再赘述。

posted @ 2012-12-18 18:05 garbageMan 阅读(1589) 评论(10) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· Open-Sora 2.0 重磅开源！
· 周边上新：园子的第一款马克杯温暖上架

garbageMan

垃圾“程序是怎样练成的”——关于《C程序设计伴侣》第A章（五）

前文链接：http://www.cnblogs.com/pmer/archive/2012/12/15/2819274.html

【样本】

——陈良乔，《C程序设计伴侣》，人民邮电出版社，2012年10月，p283

【评析】

【样本】

——陈良乔，《C程序设计伴侣》，人民邮电出版社，2012年10月，p283

【评析】

【样本】

——陈良乔，《C程序设计伴侣》，人民邮电出版社，2012年10月，p284

【评析】

【样本】

——陈良乔，《C程序设计伴侣》，人民邮电出版社，2012年10月，p284~285

【评析】

【样本】

——陈良乔，《C程序设计伴侣》，人民邮电出版社，2012年10月，p284

【评析】

【样本】

——陈良乔，《C程序设计伴侣》，人民邮电出版社，2012年10月，p286

【评析】

公告

搜索

常用链接

我的标签

积分与排名

随笔分类 (247)

相册 (1)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

garbageMan

垃圾“程序是怎样练成的”——关于《C程序设计伴侣》第A章（五）

前文链接：http://www.cnblogs.com/pmer/archive/2012/12/15/2819274.html

【样本】

——陈良乔 ，《C程序设计伴侣》，人民邮电出版社，2012年10月，p283

【评析】

【样本】

——陈良乔 ，《C程序设计伴侣》，人民邮电出版社，2012年10月，p283

【评析】

【样本】

——陈良乔 ，《C程序设计伴侣》，人民邮电出版社，2012年10月，p284

【评析】

【样本】

——陈良乔 ，《C程序设计伴侣》，人民邮电出版社，2012年10月，p284~285

【评析】

【样本】

——陈良乔 ，《C程序设计伴侣》，人民邮电出版社，2012年10月，p284

【评析】

【样本】

——陈良乔 ，《C程序设计伴侣》，人民邮电出版社，2012年10月，p286

【评析】

公告

搜索

常用链接

我的标签

积分与排名

随笔分类 (247)

相册 (1)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

　　　　——陈良乔，《C程序设计伴侣》，人民邮电出版社，2012年10月，p283

　　　　——陈良乔，《C程序设计伴侣》，人民邮电出版社，2012年10月，p283

　　——陈良乔，《C程序设计伴侣》，人民邮电出版社，2012年10月，p284

　　——陈良乔，《C程序设计伴侣》，人民邮电出版社，2012年10月，p284~285

　　——陈良乔，《C程序设计伴侣》，人民邮电出版社，2012年10月，p284

　　——陈良乔，《C程序设计伴侣》，人民邮电出版社，2012年10月，p286