摘要: @TeamSH-IT讨论中提出的一些问题及解决方法: 问题:Hu Renjun要先实现了一个简单的问答去重,但是没有数据来测试呀!而且我们在开发的过程中,爬虫组并不会提供他们爬取的结果,那我们的测试数据怎么搞定? 小组讨论结果:HRJ如果需要可以自己手动去搜集几个数据,在Lian Zhaopeng 和 Li Bin开发的功能实现后,我们应当收集一些数据并存入数据库中,方便系统整体的调试和以后的功能演示。 问题:譬如百度知道等问答网站,一个问题可能拥有很多回答,需要保存多种回答么? 小组讨论结果:暂时只保存一种,在信息抽取部分要尽量抽最佳的回答。详细的完成情况:组员今天任务明天任务Hu ... 阅读全文
posted @ 2012-11-01 23:28 teamshit 阅读(224) 评论(0) 推荐(0) 编辑