软工第一次作业进度记录2

1. 进度：

编码真的真的真的完成了。再也不重构了。

将string改为char数组，增大了哈希表容量，加快了速度。

采用nunit框架单元测试，能够通过自己的单元测试，但是对sample结果还是不一样。

2. 现有模块：

traverse_file：通过io.h遍历文件夹。已经彻底调试过，能应对空文件夹等可能出bug的情况。

count：由于文件读写太慢，决定字符统计、单词统计两个模块一起进行。这个模块通过输入流，将各个字符分别发送给两个模块，让两个模块各自计数。

count_char：通过字符流统计字符数、行数。

word_pool：快速存取、计数单词与词组。

WordPool类使用两个拉链式哈希表，分别存储单词与词组。
可以将单词的expression（实际表达式）转化为format（去掉数字后缀，全部小写）。将两个单词的expression、format分别拼接成词组的expression、format。
单词长度限制为WORD_SIZE，暂定20。该部分不对字符串合法性进行检查。
用结构体存取、统计给定的长度有限expression与format，并将长度过长的丢弃。wnode结构体为单词节点，pnode结构体为词组节点。

count_word：通过字符流解析单词，将单词与词组存入word_pool。

主模块：获取命令行参数，调用traverse_file模块获得各个文件名，打开文件流，调用count计数。

3. 废除模块：

cmd_analyse：最简单的模块。只是单纯通过argc、argv读出地址。

posted @ 2018-03-27 17:59 Jenna_Wu 阅读(126) 评论(1) 收藏举报

刷新页面返回顶部

Jenna_Wu