个人项目

1.学号2018*****7198;
姓名:贾振年
仓库:https://gitee.com/jia_zhennian/word-frequency
2.搭建配置开发环境:预计时间15min,实际时间10min.
在码云中获取作业仓库:预计时间5min,实际时间5min.
完成作业要求实现的程序:预计时间72h,实际时间12h.
为程序撰写单元测试:预计时间5h,实际时间2h.
对程序进行效能分析:预计时间1h,实际时间45min
3.首先按照任务步骤进行,首先获取文本内容,进行文本遍历,然后查询26个字母频率,这部分通过百度搜索查询获得思路进行从多到少的排序,并进行小数点后两位的判断.然后读取一个 txt 文本文件;
统计文件里面每个词出现的次数;进行排序,打印出频率最高的10个词。第三步先构建停用词的Map表,方便后续判断词是否在该Map表内.
4.创建测试类,利用JUnit写测试代码并测试,导入Gone_with_the_wind.txt,创建方法进行测试.
5.

posted @ 2020-10-09 21:58  小阁楼~初夏  阅读(106)  评论(0编辑  收藏  举报