摘要: 1. 相关性:主题相关和用户相关2.相关性是二元相关还是多元相关信息检索模型早期信息检索模型是布尔模型和向量空间模型,现在是概率模型;布尔检索通过在检索中加入AND、OR、NOT,临近运算操作符和通配符也常用于布尔查询中。该应用主要是论文查询,缺点是主要依赖与用户的查询行为。没有复杂的排序过程。向量空间模型,这个模型简单直观、实现的框架便于进行词项额加权、排序和相关反馈工作。Di=(di1,di2.....din).期中di表示第j个词项的权值,一个包含n个文档的数据集词项的权值是通过简单的计算词项在文档中出现的次数来获得。基于这种标识,文档可以通过计算标识文档和查询之间的距离来排序、使用相似 阅读全文
posted @ 2013-12-23 21:57 曹守鑫 阅读(1775) 评论(0) 推荐(0) 编辑