摘要:
TeamSHIT今天隋宇豪同学非常高效地和UI小组协商,经过2次迭代终于把Pipeline-UI的数据格式敲定。然后在讨论中我们明确了那些各个表的各个域存放什么信息,由谁负责提取和维护。今天的阅读情况如下:李斌:基于概率模型的Web信息抽取基于概率信息抽取模型的Top-k查询彭笑东:基于二阶隐马尔可夫模型的文本信息抽取 基于遗传算法的Web信息抽取隋宇豪:HTML文件的文本信息预处理技术 基于Web的电子期刊元数据信息抽取方法组员今天任务明天任务胡仁君任务290学习信息抽取相关论文;任务292继续小组论文学习交流会任务367确定信息抽取的主要算法彭笑东 任务289阅读了解信息抽取基本算... 阅读全文