摘要: 索引分词IndexTokenizer是面向搜索引擎的分词器,能够对长词全切分,另外通过term.offset可以获取单词在文本中的偏移量。 任何分词器都可以通过基类Segment的enableIndexMode方法激活索引模式。 # *****************************索引分词 阅读全文
posted @ 2022-04-08 08:00 青竹之下 阅读(75) 评论(0) 推荐(0) 编辑