摘要: 把输入的文本块按照一定的策略进行分解,并建立倒排索引。在Lucene的架构中,这个过程由分析器(analyzer)完成。 主要组成 character filter:接收原字符流,通过添加、删除或者替换操作改变原字符流。例如:去除文本中的html标签,或者将罗马数字转换成阿拉伯数字等。一个字符过滤器 阅读全文
posted @ 2021-12-27 14:59 再见傅里叶 阅读(937) 评论(0) 推荐(0) 编辑