Daily Srum 10.28
这两天我们和其他两组进行了一次会议,主要讨论的是用什么框架来搭建这个平台。在线系统的那一组希望我们用nutch、solr、hbase这一套工具,这对于我们两组来说是一次挑战,毕竟我们一开始用的是关系型数据库,而王鹿鸣、李云涛他们一组却希望我们用NoSQL来做,这毕竟是需要学习成本的,所以我们的进度可能有所停滞,虽然我们前面两组采用的他们的方法,但是为了以防万一,我们还会在以前的基础上进行开发,也就是我们将会进行双线程的工作,任务量十分大,但是我们坚信我们一定可以做完。
这两天时间完成的任务:
- 我们才发现这次的所有文章都是英文的,所以我们用lucene这个分词,分词效果还不错。
- 数据库的原本关系已经建立好了,原来的进度我们不会落下,现在新的方面我们也会进行拓展。
- 初步在平台上搭建了一些简单的界面
- 翻译已经完成,就是用的百度的翻译api
- 为了更为符合软件工程中敏捷编程的思想,我打算直接用分词器中的提取关键词这个功能。
- 建立一些简单的asp.net搭建的界面
当然我们也遇到了一些困难,在处理这些问题的时候,我们会一起讨论、搜集资料,然后运用相对而言让自己满意的算法的完成这些问题。对于nutch、solr、hbase这一套工具,我们搭建平台上确实遇到了或多或少的障碍,但是这不会停滞我们前进的脚步。
明天的任务:
Members | Tomorrow's Task |
---|---|
陈谋 | 去重、去噪 |
李剑锋 | 学习NoSQL的相关知识,掌握如何搭建相关平台 |
潘成鼎 | 完成E-R模型的数据库建设 |
卢惠明 | 用lucene工具进行关键词的提取 |
刘夕霆 | asp.net搭建HTML网页 |
仉伯龙 | 完成网页内容构建 |
我们的进度情况(燃尽图):