2013年11月24日
摘要: 今日总结: 针对昨天讨论的结果,今天我们并没有开会,对昨天的任务分配稍作修改,之后大家按照分配好的任务努力。在晚上的时候,我们在群里共享了自己今天的劳动成果,并且PM做出总结,布置明天的任务。今日组员所完成任务具体如下:1、柴泽华(PM):学习tf-idf算法,并且为组员讲明其中的关键部分。★TF-IDF算法在两个方面都有重要的作用:1)提取文章的关键字词2)根据关键词检索出相关度高的文本。这个算法被公认为信息检索领域最重要的发明,是很多算法的模型的基础。 在一份给定的文件里,词频 (term frequency, TF) 指的是某一个给定的词语在该文件中出现的次数。这个数字通常会被正规化,以 阅读全文
posted @ 2013-11-24 11:02 IloveSE 阅读(240) 评论(0) 推荐(0) 编辑