Fanr

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2011年6月7日

摘要: 排名计算问题计算排名的过程,取决于一系列因素。不同语言的断字符对文本进行的词汇切分也不同。例如,字符串“dog-house”可以被一种断字符断为“dog”和“house”而被另一种断字符断为“dog-house”。这意味着匹配和排名将根据所指定语言而有所不同,因为不仅词不同,而且文档长度也不同。文档长度的差异可能会影响所有查询的排名。诸如 IndexRowCount 之类的统计信息可能会大不相同。例如,如果一个目录的主索引有二十亿行,那么对一个新文档的索引将被编制为内存中的中间索引,而基于该内存中索引内的文档数对该文档的排名可能与主索引中的文档排名不同。因此,建议在完成产生大量要创建索引或重新 阅读全文
posted @ 2011-06-07 13:10 Fanr_Zh 阅读(386) 评论(0) 推荐(0) 编辑