Daily Srum 10.26
Daily Scrum Meeting
虽然TFS的相关使用已经在上面贴出来一段时间,但是要运用TFS还是有些困难的,特别是TFS的代码管理机制,所以我们让部分人先弄清楚,然后再教授给其他人。终于大家都进入了状态,弄懂了TFS的运用方式。
这两天时间完成的任务:
- 完成了分词器的选择,初步决定:在处理中文文档是用中科院张华平博士NLPIR/ICTCLAS2015分词系统下载包;英文文档和中英文混合文档选用的是Apache Lucene分词器。
- 完成数据库实体关系间的联系:用E-R模型来表示。初步完成数据库的连接操作。
- 简单的UI设计(可能进度有点慢)
- 用百度翻译api完成了英汉翻译。(我们会对多种api进行测试,攫取其中最好的)
- 已经明白了TF-IDF的含义,能够初步完成提取关键词的步骤;当然如果用自己分词器来完成分词的效果的话,速度会更快,效果可能也会更好。后面我们将在这两种方案中进行选择。
- 初步学习了asp.net
当然我们也遇到了一些困难,在处理这些问题的时候,我们会一起讨论、搜集资料,然后运用相对而言让自己满意的算法的完成这些问题。
明天的任务:
Members | Tomorrow's Task |
---|---|
陈谋 | 完成分词器的相应运用,特别是分词 |
李剑锋 | 完成翻译api的选择 |
潘成鼎 | 完成E-R模型的数据库建设 |
卢惠明 | 对比分词器的提取关键词效果和自己TF-IDF的提取关键词的效果 |
刘夕霆 | 完成简单的asp.net运行架构 |
仉伯龙 | 了解客户需求,拟定相关的技术文档 |
我们的进度情况(燃尽图):