摘要: 概念解释: 全文搜索引擎会用某种算法对要建索引的文档进行分析, 从文档中提取出若干Token(词元), 这些算法称为Tokenizer(分词器), 这些Token会被进一步处理, 比如转成小写等, 这些处理算法被称为Token Filter(词元处理器), 被处理后的结果被称为Term(词), 文档 阅读全文
posted @ 2017-01-22 17:27 二月长安 阅读(509) 评论(0) 推荐(0) 编辑