第五次作业 - 结对作业2

结对同学的博客链接：031602312洪泽波
 本作业博客的链接
 Github项目地址

PSP2.1	Personal Software Process Stages	预估耗时（分钟）	实际耗时（分钟）
Planning	计划	0	0
· Estimate	· 估计这个任务需要多少时间	240	420
Development	开发	0	0
· Analysis	· 需求分析 (包括学习新技术)	10	10
· Design Spec	· 生成设计文档	0	0
· Design Review	· 设计复审	0	0
· Coding Standard	· 代码规范 (为目前的开发制定合适的规范)	0	0
· Design	· 具体设计	10	10
· Coding	· 具体编码	80	80
· Code Review	· 代码复审	0	0
· Test	· 测试（自我测试，修改代码，提交修改）	10	10
Reporting	报告	120	300
· Test Repor	· 测试报告	0	0
· Size Measurement	· 计算工作量	10	10
· Postmortem & Process Improvement Plan	· 事后总结, 并提出过程改进计划	0	0

解题思路描述与设计实现说明

爬虫使用【3'】

先匹配得到所有论文的简介页面，然后再匹配得到标题和摘要，详见github

代码组织与内部实现设计（类图）【6'】

说明算法的关键与关键实现部分流程图【6'】

关键代码解释【2'】

先判断参数，再匹配单词组与不合法单词：
(.?)[a-z]{0,3}[0-9]+.?[^a-z0-9]
再匹配单词(流程与上次作业差不多)，加了2个列表用于缓存单词和分隔符，然后组成单词组加入TreeMap

附加题设计与展示【20'】

无

性能分析与改进【6'】

无

单元测试【5'】

没有写函数，只测了例子

输入：
0
Title: Monday Tuesday Wednesday Thursday
Abstract: Monday Tuesday Wednesday Thursday Friday

命令行：java Main -i C:\Users\ASUS\Desktop\0.txt -m 3 -n 3 -w 1 -o o.txt

输出：
characters: 74
words: 9
lines: 2
<monday tuesday wednesday>: 11
<tuesday wednesday thursday>: 11
<wednesday thursday friday>: 1

输入：
0
Title: abcd 1abcd abcd (abcde
Abstract: abcd a1abcd abcd (abcde abc1 abcd

命令行：java Main -i C:\Users\ASUS\Desktop\0.txt -m 2 -n 3 -w 1 -o o.txt

输出：
characters: 56
words: 7
lines: 2
<abcd (abcde>: 11

贴出Github的代码签入记录【1'】

遇到的代码模块异常或结对困难及解决方法【5'】

无

评价你的队友【2'】

非常好

学习进度条【1'】

第N周	新增代码(行)	累计代码(行)	本周学习耗时(小时)	累计学习耗时(小时)	重要成长
1	0	0	1	1
2	100	100	7	8	学会了HashMap的排序
3	0	100	7	15	学了NABCD模型
4	0	0	2	17
5	100	200	10	27	学会了简单地抓取网页信息

posted on 2018-09-23 17:10 陈超星阅读(316) 评论(0) 收藏举报