第三次作业 - 结对项目1
软工实践第三次作业-结对作业
一、结对信息
二、NABCD模型
(1)Need--需求
根据题目来看,用户希望自己能够了解CVPR、ICCV、ECCV三大顶会的论文研究热点,需要收集近几年三大顶会的论文来进行筛选分析,以便找出热门研究方向,让自己能在毕业前完成一篇站在时代前沿的优秀论文。
根据网上list一篇篇查找论文费时费力,效率低下,所以用户迫切需要一个能够迅速爬取顶会论文基本信息,了解各篇论文的研究方向,并且能分析出顶会论文研究热点的工具。
-
用户给定论文列表
- 通过论文列表爬取论文的题目、摘要、原文链接
- 对论文列表进行增删改操作(今年、近两年、近三年)
-
对爬取信息进行结构化处理,分析top10个热门领域或热门研究方向
- 可对论文属性(oral、spotlight、poster)进行筛选及分析
- 形成如热词图谱之类直观的查看方式
-
可进行论文检索,当用户输入论文编号、题目、作者等基本信息,分析返回相关的paper、source code、homepage等信息
-
可对多年间、不同顶会的热词呈现热度走势对比
-
可进行数据统计,例如每个国家录用文章的分析、每个学校录用文章的分析、哪个学校哪方面的研究方向比较强等
以上是用户已经明确给出的需求,但是了解用户的需求不能仅靠用户的描述,也需要开发者站在用户的角度来思考。经过一番考虑,我们认为也许可以再加上一个可对论文进行收藏的需求。当用户看到某篇自己非常喜欢的,或许将来还会用到的论文,可以对该论文进行添加收藏,之后可在自己的收藏夹中直接找到,更加方便快捷。
(2)Approach--做法
考虑到适用性,系统应用于web端。针对上述需求,我们讨论出来的解决方法如下
- 提供空白论文列表,用户可输入想要爬取的论文信息,用户可随时对论文列表进行操作,爬取完成后自动跳转到论文信息页面;
- 对爬取的论文信息进行分析,提供多种选择条件进行分析,如选定全部论文/选定某所学校/选定某个国家/选定某个年份/选定某种论文属性,分析top10个热门研究领域或热门方向,以热词图谱或者折线图的方式展现出来;
- 设置搜索栏,并提供论文编号、题目、作者、论文属性等搜索条件,搜索后可返回论文的详细信息。如选择的条件为作者,那么搜索后将返回该作者的所有论文信息;
- 设置年份、顶会等筛选条件,返回选中条件的热词走势对比图;
- 用户可输入想要了解的国家/学校/作者名称,返回该国家/学校/作者近年来的主要研究方向和领域。
(3)Benefit--好处
从用户的角度来考虑,我们认为使用本平台来进行论文信息统计分析的好处如下:
- 为用户节省了大量查阅资料的时间,如今网上的论文资料数不胜数,各类各样五花八门,用户不可能对每一篇论文都进行浏览以查看是否对自己有用。使用本平台,用户能够快速而准确地获得自己所需要的论文信息,并得到最充分最仔细的统计分析,节省了不必要浪费的时间,提高自己的学习效率;
- 在用户面对数量庞大的论文时,经常会感觉找不到学习的方向,使用本平台的服务,用户能够粗知当下顶会上研究方向的学术源流,找到读书门径,发现对自己有用的论文,提高自己的学术水平;
- 本平台界面简洁明了,美观大方,操作简单易懂,
不含任何广告,用户可以很方便地按自己的想法进行操作,对用户友善度极高。
(4)Competitors--竞争
- 在外围功能方面,界面美观简洁,设计良好,能够给用户非常好的体验感。
- 在必要需求方面,论文爬取速度快,对论文的筛选分析细致到位,可信度高。
- 本平台拥有论文收藏功能,用户能够非常方便地收藏自己喜欢的论文,友善度max。
- 具有数据统计和数据分析功能,用户能够非常直观地查看各个国家、学校的论文录用量以及各个学校的主要研究方向。
- 目前市场上CiteSeer、微软学术搜索等平台也提供有论文检索功能,但是相对缺乏数据分析和统计的功能。
(5)Delivery--推广
- 鉴于本平台的核心功能是爬取论文并分析热门研究方向,所以主要的用户群体应该是大三大四的同学以及研究生学长学姐和各位老师。我们会先发挥自己的人脉关系,通过自己的同学朋友向其他人介绍我们的产品,先在本学院推广开。
- 待到在本学院内打开市场后,争取得到校级部门协会或者校方管理部门的支持,再向全校进行推广,让更多的同学老师认识并使用我们的产品。
- 在用户的使用过程中进行调查,收集用户的反馈意见,分析产品存在的缺陷与不足,不断提高产品质量,增强用户体验,在用户群体中争取更好的口碑。
三、结对照片
四、PSP表格
PSP2.1 | Personal Software Process Stages | 预估耗时(分钟) | 实际耗时(分钟) |
---|---|---|---|
Planning | 计划 | 60 | 60 |
· Estimate | · 估计这个任务需要多少时间 | 60 | 60 |
Development | 开发 | 1920 | 1620 |
· Analysis | · 需求分析 (包括学习新技术) | 120 | 240 |
· Design Spec | · 生成设计文档 | 120 | 60 |
· Design Review | · 设计复审 | 60 | 60 |
· Coding Standard | · 代码规范 (为目前的开发制定合适的规范) | 0 | 0 |
· Design | · 具体设计 | 120 | 240 |
· Coding | · 具体编码 | 1440 | 960 |
· Code Review | · 代码复审 | 60 | 60 |
· Test | · 测试(自我测试,修改代码,提交修改) | 0 | 0 |
Reporting | 报告 | 130 | 130 |
· Test Repor | · 测试报告 | 0 | 0 |
· Size Measurement | · 计算工作量 | 10 | 10 |
· Postmortem & Process Improvement Plan | · 事后总结, 并提出过程改进计划 | 120 | 120 |
| | 合计 |2110 |1810
五、设计说明
- 论文列表
用户可通过"+" "-"新增或者删除自己的爬取条件,也可以直接导入文件进行爬取。当条件过多时,通过搜索栏可以直接找到自己之前设置过的条件。
- 检索列表
可通过搜索栏直接搜索某篇论文,点击论文标题即可查看论文的详细信息,看到某篇特别喜欢的论文时,通过点击爱心进行收藏。
- 数据统计
选择搜索条件,在搜索栏输入国家或者学校,可以查看某个国家或学校的论文录用量在顶会所有录用论文的占比,并可查看该国家/学校录用论文的主要研究方向。
- 热度走势
查看不同顶会近几年的热词图谱,点击某一热词在图谱下方显示该方向近几年的热度走势。
- 个人中心
修改自己的个人资料,介绍自己的学校及近期研究方向。
- 我的收藏
用户收藏的论文,可通过国家、顶会、年份进行筛选检索
六、学习进度
第N周 | 新增代码行 | 累计代码行 | 本周学习耗时(小时) | 累计学习耗时(小时) | 重要成长 |
---|---|---|---|---|---|
1 | 600 | 600 | 20 | 20 | 1. dl4j库的使用 keras模型导入java 2. k-means java实现 3.水平投影图像分割 |
2 | 1400 | 2000 | 30 | 50 | 1. dl4j nd4j 踩坑 |
七、遇到的困难及解决方法
- 之前做Android, 所以有一些做原型的经验,总体还好,但是有一些细节上疑惑了比较久,例如论文列表的导入方式。
一点点小感想
- 完成得比较匆忙。
- 原型设计比较简陋,只完成了基础部分。在原型设计上果断选择了Material Design风格,最终效果还行。