posts - 145,comments - 23,views - 73万

Field类是lucene在索引过程中的一个很重要的类,该类控制着域值被索引的方式

域选项主要包括以下几种选项:域索引选项、域存储选项、域的项向量选项、域的排序选项等

域索引选项:通过倒排索引来控制域值是否能够被搜索

               Index.ANALYZED,将文本域分析成为一个或多个独立的语汇单元,每个语汇单元都能够被搜索

               Index.NOT_ANALYZED,对文本域进行索引但是不进行分词(适用于对人名,URL,电话号码等需要进行精确匹配的搜索)

               Index.ANALYZED_NO_NORMS 和Index.ANALYZED相似,但是不存储索引时的加权信息(相对来说节省内存)

      Index.NOT_ANALYZED_NO_NORMS  和Index.NOT_ANALYZED相似但是不存储索引时的加权信息               

               Index.NO 使对应的域不能够被搜索

 

域存储选项:确定是否存储域的真实值,以便在搜索的时候进行恢复

      Stroe.YES 指定存储域值(web页面的URL,数据库的ID,文章标题等可以进行存储)

                Store.NO 不存储域值

 

项向量选项:可以实现类似查找同义词的这种功能(后边文章详细介绍)

 

域排序选项:

              为了实现域排序的功能必须对文档进行索引(不能使用Index.NO),并且每个对应的文档必须包含一个语汇单元,也就不能对该域进行分词操作(例外情况是可以使用只会生成一个语汇单元的分析器,比如KeyWordAnalyzer)

 

多值域:

         想象这样一种情况,一个文档用域来表示作者,但是一本书的作者可能不止一个,这时,我们可以在该域里写入多个不同的值,使其成为一个多值域

         类似以下代码        

 

Document document = new Document;
for(String author : authors){
    document.add(
              new Field ("author",author,Field.Store.YES,Field.Index.ANALYZED)); 
}

 

posted on   梦中彩虹  阅读(1242)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示