团队作业4——第一次项目冲刺(Alpha版本)4.22

·本次会议为第一次Scrum Meeting会议~

·由于本次会议项目经理召开时间为9:30,在教学楼教室召开,召开时长约30分钟,探讨了今日要做的任务以及后续所要开展的工作。

1.站立式会议照片

2.每个人的工作

任务表

队员 今日进展 明日安排
王婧 #3查重:根据算法进行txt文档查重 #3查重:根据算法进行txt文档查重
柯怡芳 #8(完成)完成今日博客随笔,跟进任务 #10完成明日博客随笔,跟进任务
陈艺菡 #1(完成)导入:利用爬虫抓取博客内容#2导入:利用爬虫抓取多个博客内容 #7导入:将多个博客内容依次生成多个本地txt
钱惠 #3查重:根据算法进行txt文档查重 #8查重:对多个txt文件进行批量查重
尼玛 #5(完成)完成4月22日项目燃尽图 #9完成4月23日项目燃尽图
林凯 #4实现Web界面 #4实现Web界面
####工作中遇到的困难: ``` (1).在利用爬虫抓取博客内容时遇到了一些问题,由于使用了插件jar包Jsoup,得到特殊的Elements类型不适合io文件流,最终进行类型转换再导出到文件解决了该问题。 (2).一开始进行了一些查重算法的资料,并下载了一个相关java包,有许多种类的查重算法、余弦定理等。根据我们实际情况出发,想多考虑一些因素 ,在做一开始初始模型时,使用两段语句进行匹配,但结果查重效率不高 ,改善后也只是一些简单结果统计。 ``` ###3.燃尽图 横坐标:时间,纵坐标:任务数 橙线:设置的卡片数在规定的工作日内完成的理想情况 蓝线:实际完成的卡片数 ![](http://images2015.cnblogs.com/blog/1136060/201704/1136060-20170422134440712-2073842483.png)

4.代码/文档签入记录

5.项目程序/模块的最新(运行)截图

(暂时没有)

posted on 2017-04-22 22:14  rgxz  阅读(181)  评论(0编辑  收藏  举报