第五次作业 - 结对作业2

结对同学的博客链接:031602312洪泽波
本作业博客的链接
Github项目地址

PSP2.1 Personal Software Process Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 0 0
· Estimate · 估计这个任务需要多少时间 240 420
Development 开发 0 0
· Analysis · 需求分析 (包括学习新技术) 10 10
· Design Spec · 生成设计文档 0 0
· Design Review · 设计复审 0 0
· Coding Standard · 代码规范 (为目前的开发制定合适的规范) 0 0
· Design · 具体设计 10 10
· Coding · 具体编码 80 80
· Code Review · 代码复审 0 0
· Test · 测试(自我测试,修改代码,提交修改) 10 10
Reporting 报告 120 300
· Test Repor · 测试报告 0 0
· Size Measurement · 计算工作量 10 10
· Postmortem & Process Improvement Plan · 事后总结, 并提出过程改进计划 0 0

解题思路描述与设计实现说明

爬虫使用【3'】

先匹配得到所有论文的简介页面,然后再匹配得到标题和摘要,详见github

代码组织与内部实现设计(类图)【6'】

说明算法的关键与关键实现部分流程图【6'】

关键代码解释【2'】

先判断参数,再匹配单词组与不合法单词:
(.?)[a-z]{0,3}[0-9]+.?[^a-z0-9]
再匹配单词(流程与上次作业差不多),加了2个列表用于缓存单词和分隔符,然后组成单词组加入TreeMap

附加题设计与展示【20'】

性能分析与改进【6'】

单元测试【5'】

没有写函数,只测了例子

输入:
0
Title: Monday Tuesday Wednesday Thursday
Abstract: Monday Tuesday Wednesday Thursday Friday

命令行:java Main -i C:\Users\ASUS\Desktop\0.txt -m 3 -n 3 -w 1 -o o.txt

输出:
characters: 74
words: 9
lines: 2
<monday tuesday wednesday>: 11
<tuesday wednesday thursday>: 11
<wednesday thursday friday>: 1

输入:
0
Title: abcd 1abcd abcd (abcde
Abstract: abcd a1abcd abcd (abcde abc1 abcd

命令行:java Main -i C:\Users\ASUS\Desktop\0.txt -m 2 -n 3 -w 1 -o o.txt

输出:
characters: 56
words: 7
lines: 2
<abcd (abcde>: 11

贴出Github的代码签入记录【1'】

遇到的代码模块异常或结对困难及解决方法【5'】

评价你的队友【2'】

非常好

学习进度条【1'】

第N周 新增代码(行) 累计代码(行) 本周学习耗时(小时) 累计学习耗时(小时) 重要成长
1 0 0 1 1
2 100 100 7 8 学会了HashMap的排序
3 0 100 7 15 学了NABCD模型
4 0 0 2 17
5 100 200 10 27 学会了简单地抓取网页信息
posted on 2018-09-23 17:10  陈超星  阅读(315)  评论(0编辑  收藏  举报