Daily Scrum 2012/11/28
TeamSHIT
今天隋宇豪同学非常高效地和UI小组协商,经过2次迭代终于把Pipeline-UI的数据格式敲定。然后在讨论中我们明确了那些各个表的各个域存放什么信息,由谁负责提取和维护。
今天的阅读情况如下:
李斌:基于概率模型的Web信息抽取 基于概率信息抽取模型的Top-k查询
彭笑东:基于二阶隐马尔可夫模型的文本信息抽取 基于遗传算法的Web信息抽取
隋宇豪:HTML文件的文本信息预处理技术 基于Web的电子期刊元数据信息抽取方法
组员 | 今天任务 | 明天任务 |
胡仁君 |
任务290 学习信息抽取相关论文; |
任务292 继续小组论文学习交流会 任务367 确定信息抽取的主要算法 |
彭笑东 |
任务289 阅读 了解信息抽取基本算法
|
任务289 学习信息抽取基本算法 任务367 确定信息抽取的主要算法
|
李斌 |
任务292 学习信息抽取相关论文
|
任务292 学习信息抽取相关论文 任务367 确定信息抽取的主要算法 |
隋宇豪 |
任务288 阅读论文; 任务287 相关数据库的定义和实现 和UI小组合爬虫组协商数据格式 |
任务287 相关数据库的定义和实现 建表 |
燃尽图和燃速图