摘要: 1、analyzer的组成 CharacterFilters:针对原始文本进行处理例如去掉html Tokenizer:按照规则切分单词 Token Filter:将切分好的单词进行二次加工 2、分词器 standard 默认分词器,按词切分,小写处理 stop 小写处理,停用词过滤(a,the,i 阅读全文
posted @ 2020-03-06 12:13 fat_girl_spring 阅读(417) 评论(0) 推荐(0) 编辑