- 个人介绍
- PSP流程管理
计划及开发阶段
阶段 |
预计时间 |
时间 |
作业要求分析 |
10分钟 |
30分钟 |
任务规划 |
30分钟 |
30分钟 |
步骤零实现 |
35分钟 |
20分钟 |
步骤一实现 |
40分钟 |
25分钟 |
步骤二实现 |
15分钟 |
5分钟 |
步骤三实现 |
40分钟 |
未完成 |
步骤四实现 |
30分钟 |
未完成 |
- 程序设计思路
- 步骤零 输出某个英文文本文件中 26 字母出现的频率,由高到低排列
- 使用IO流从文件中读取文件内容
- 使用正则表达式替换非A-Z、a-z的内容
- 将替换后的结果转换为char类型数组
- 使用Map保存结果(key唯一,key存在时更改value,不存在时置入)
- 对key的结果进行处理(取百分比、排序)
- 输出结果
- 步骤一 输出单个文件中的前 N 个最常出现的英语单词。
- 输出不重复的单词,按照出现次数排列
- 使用正则表达式对读取的内容进行处理(条件:非字母数字)
- 使用Map保存结果(key唯一,key存在时更改value,不存在时置入)
- 对key的结果进行处理(排序)
- 返回结果
- 指定文件目录,对目录下每一个文件执行 wf.exe -f 的操作。
- 获得目录下文件列表
- 如果是文件,执行-f操作,如果是目录,根据是否携带迭代标识处理,如果携带迭代标识,调用自身方法,对本目录下的所有内容递归处理
- 返回结果
- 支持 -n 参数,输出出现次数最多的前 n 个单词
- 在输出时,判断是否存在-n参数,如果存在,则根据-n指定的单词数量进行控制
- 步骤2 支持stop words
- 在统计词频时,判断是否存在停词表参数
- 存在停词表参数时,读取停词表文件
- 对停词表文件进行处理,得到List
- 在处理词频时,判断其是否在停词表内,如果存在,跳过单次循环
- 单元测试思路
- 对于步骤零的测试思路
- 不携带文件对象
- 携带错误文件对象(不存在)
- 携带错误文件对象(为目录)
- 携带正确文件对象
- 效能分析报告
posted @
2020-10-09 22:45
FengXuan
阅读(
122)
评论()
编辑
收藏
举报