摘要:
1) 团队成员的简介和个人博客地址团队:TeamSHIT团队博客:http://www.cnblogs.com/teamshit/团队成员如下:姓名职务个人博客地址胡仁君PM,开发员www.cnblogs.com/hurj/彭笑东开发员www.cnblogs.com/ipxd92513/李斌测试员www.cnblogs.com/kevinlb/隋宇豪数据库维护员www.cnblogs.com/yhsui/连昭鹏(M2已转会至SB)开发员www.cnblogs.com/lzplzp/2) 我们要做软件工程, 那就要有一点工程的样子:团队项目:学霸Pipeline项目目标:处理Cralwer爬取的 阅读全文
摘要:
M2 PostmortemTeamSHIT2013/01/07设想和目标我们的软件要解决什么问题?是否定义得很清楚?是否对典型用户和典型场景有清晰的描述?我们实现的软件是一个网上教学问答系统,具体负责数据Pipeline部分,即处理爬虫爬取的网页,按照UI组的要求提取相应的数据并写入数据库中。具体要求是分析非问答型网页(type = webpage),提取网页标签,对每个标签抽取标签预览。是否有充足的时间来做计划?M2的开发周期是4周,第1周用来做计划。到M2我们对Pipeline的系统框架和功能已经了解足够详细,计划的内容主要是数据抽取部分的算法。团队在计划阶段是如何解决同事们对于计划的不同 阅读全文