CSDN博主:【java_wxid】
CSDN博主:点击【Java廖志伟】
CSDN社区:点击【幕后大佬】
码云:点击【互联网Java工程师知识扫盲】
随笔 - 882,  文章 - 0,  评论 - 1,  阅读 - 51800

linux安装Solr:可以参考全文检索工具elasticsearch:第二章:安装配置配置类似

点击下载solr

windows中Solr安装

1:安装 Tomcat,解压缩即可。

2:解压 solr。

3:把 solr 下的dist目录solr-4.10.3.war部署到 Tomcat\webapps下(去掉版本号)。

4:启动 Tomcat解压缩 war 包

5:把solr下example/lib/ext 目录下的所有的 jar 包,添加到 solr 的工程中(\WEB-INF\lib目录下)。

6:创建一个 solrhome 。solr 下的/example/solr 目录就是一个 solrhome。复制此目录到C盘改名为solrhome  

7:关联 solr 及 solrhome。需要修改 solr 工程的 web.xml 文件。

    <env-entry>

       <env-entry-name>solr/home</env-entry-name>

       <env-entry-value>c:\solrhome</env-entry-value>

       <env-entry-type>java.lang.String</env-entry-type>

    </env-entry>

8:启动 Tomcat

http://IP:8080/solr/

localhost:8080

 

solr页面

基本查询

q  查询的关键字,此参数最为重要,例如,q=id:1,默认为q=*:*,

fl  指定返回哪些字段,用逗号或空格分隔,注意:字段区分大小写,例如,fl= id,title,sort

start  返回结果的第几条记录开始,一般分页用,默认0开始

rows  指定返回结果最多有多少条记录,默认值为 10,配合start实现分页

sort  排序方式,例如id  desc 表示按照 “id” 降序

wt  (writer type)指定输出格式,有 xml, json, php等

fq  (filter query)过虑查询,提供一个可选的筛选器查询。返回在q查询符合结果中同时符合的fq条件的查询结果,例如:q=id:1&fq=sort:[1 TO 5],找关键字id为1 的,并且sort是1到5之间的。

df   默认的查询字段,一般默认指定。

qt  (query type)指定那个类型来处理查询请求,一般不用指定,默认是standard。

indent   返回的结果是否缩进,默认关闭,用 indent=true|on 开启,一般调试json,php,phps,ruby输出才有必要用这个参数。

version   查询语法的版本,建议不使用它,由服务器指定默认值。

检索运算符

“:”  指定字段查指定值,如返回所有值*:*

 “?”  表示单个任意字符的通配

 “*”  表示多个任意字符的通配(不能在检索的项开始使用*或者?符号)

 “~”  表示模糊检索,如检索拼写类似于”roam”的项这样写:roam~将找到形如foam和roams的单词;roam~0.8,检索返回相似度在0.8以上的记录。

AND、||  布尔操作符

OR、&&  布尔操作符

NOT、!、-(排除操作符不能单独与项使用构成查询)

 “+”  存在操作符,要求符号”+”后的项必须在文档相应的域中存在²

 ( )  用于构成子查询

 []  包含范围检索,如检索某时间段记录,包含头尾,date:[201507 TO 201510]

{}  不包含范围检索,如检索某时间段记录,不包含头尾date:{201507 TO 201510}

 

IK Analyzer配置

步骤:

1、把IKAnalyzer2012FF_u1.jar 添加到 solr 工程的 lib 目录下

2、创建WEB-INF/classes文件夹  把扩展词典、停用词词典、配置文件放到 solr 工程的 WEB-INF/classes 目录下。

3、修改 Solrhome 的 schema.xml 文件(C:\solrhome\collection1\conf),配置一个 FieldType,使用 IKAnalyzer

<fieldType name=" text_ik_javawxid" class="solr.TextField">

     <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>

</fieldType>

FIle可以理解为数据库中的字段,相当于列

配置业务域

要想让solr能够存储信息,我们还得定义列,也叫域,相当于数据库中的字段

修改solrhome的schema.xml 文件  设置业务系统 Field

<field name="sku_name" type="string" indexed="true" stored="true"/>

<field name="sku_price" type="double" indexed="true" stored="true"/>

<field name="sku_desc" type=" text_ik_javawxid" indexed="true" stored="true"/>

<field name="sku_default_img" type="string"  stored="true"/>

  • name:指定域的名称
  • type:指定域的类型
  • indexed:是否索引,可以按照该列进行搜索
  • stored:是否存储
  • required:是否必须
  • multiValued:是否多值比如商品信息中一个商品有多张图片,一个Field像存储多个值的话,必须将multiValued设置为true。

复制域

可以把一些列复制到一个域中, 是一个逻辑上的概念,不是物理上的概念不是把值真正的复制到域中,这样会浪费内存空间

多个域组合在一起进行检索

Stored = false  必须为false 因为是逻辑上的域对象

<field name="sku_keywords" type="text_ik" indexed="true" stored="false" multiValued="true"/>

<!指定是从哪些域中拷贝的-->

<copyField source="sku_name" dest=" sku_keywords "/>

<copyField source="sku_price" dest=" sku_keywords "/>

<copyField source="sku_desc" dest=" sku_keywords "/>

注意:空格要去掉

动态域(这个不常用,可以不用配置)

当我们需要动态扩充字段时,我们需要使用动态域。比如规格的值是不确定的,所以我们需要使用动态域来实现。需要实现的效果如下:

配置:

<dynamicField name="item_spec_*" type="string" indexed="true" stored="true" />

 

 

 

 

 

posted on   我是廖志伟  阅读(4)  评论(0编辑  收藏  举报  
编辑推荐:
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

南北踏尘
点击右上角即可分享
微信分享提示