摘要: 拼写纠正 主要关注查询的拼写校正。例如,用户输入carot时,实际上可能想返回包含词项carrot的文档。Google的报告指出,当用户输入britian spears、britney's spears、brandy spears或者prittany spears时,实际上搜索引擎都会当成是brit 阅读全文
posted @ 2016-12-28 20:19 Mr-cc 阅读(434) 评论(0) 推荐(0) 编辑
摘要: 索引构建 如何建倒排索引的过程称为索引构建(index construction 或 indexing),而将构建索引的程序或计算机称为索引器(indexer)。索引构建算法的设计受硬件的配置所制衡。 索引器需要原始文本,但是文本可能会采用各种编码格式。索引器对中间文件和最后的索引文件进行压缩或者解 阅读全文
posted @ 2016-12-28 20:15 Mr-cc 阅读(509) 评论(0) 推荐(0) 编辑