2012年8月13日

信息检索导论学习笔记(3)

摘要: 词典及容错式检索 如上图,倒排索引记录表构建好后。对于查询请求“solr”,我们的首要任务是确定查询词项solr是否在词典的词项词汇表中,如果在,则返回该词项对应的倒排记录表的指针。如何在数据结构(即词典)中快速定位词项? 词典(即存储词项词汇表的数据结构) 快速定位词项主要有两大类解决方案 哈希表方式 每个词项通过哈希函数映射成一个整数,映射函数的目标空间需要足够大,以减少哈希结果... 阅读全文

posted @ 2012-08-13 12:48 God bless you 阅读(4179) 评论(3) 推荐(0) 编辑

导航