solr 重要的知识点

1 solr 查询参数说明

常用

1) q - 查询字符串，必须的。
2) fl - 指定返回那些字段内容，用逗号或空格分隔多个。
3) start - 返回第一条记录在完整找到结果中的偏移位置， 0 开始，一般分页用。
4) rows - 指定返回结果最多有多少条记录，配合 start 来实现分页。
5) sort - 排序，格式： sort=<field name>+<desc|asc>[,<field name>+<desc|asc>]… 。示例：（ inStock desc, price asc）表示先 “inStock” 降序, 再 “price” 升序，默认是相关性降序。注：排序字段 只能针对数值型如： int,dobuble 等…
6) wt - (writer type)指定输出格式，可以有 xml, json, php, phps, 后面 solr 1.3 增加的，要用通知我们，因为默认没有打开。
7) fq - （ filter query）过虑查询，作用：在 q 查询符合结果中同时是 fq 查询符合的，例如：q=mm&fq=date_time:[20081001 TO 20091031]，找关键字 mm，并且 date_time 是 20081001 到 20091031 之间的。官方文档：http://wiki.apache.org/solr/CommonQueryParameters#head-6522ef80f22d0e50d2f12ec487758577506d6002

2） 不常用

1) q.op - 覆盖 schema.xml 的 defaultOperator（有空格时用"AND"还是用"OR"操作逻辑），一般默认指定
2) df - 默认的查询字段，一般默认指定
3) qt - （ query type）指定那个类型来处理查询请求，一般不用指定，默认是 standard。
3） 其它
1) indent - 返回的结果是否缩进，默认关闭，用 indent=true|on 开启，一般调试 json,php,phps,ruby 输出才有必
要用这个参数。
2) version - 查询语法的版本，建议不使用它，由服务器指定默认值。

2 solr检索运算符

1. “ :” 指定字段查指定值，如返回所有值*:*
2. “ ?” 表示单个任意字符的通配
3. “ *” 表示多个任意字符的通配（不能在检索的项开始使用*或者?符号）
4.“ ~” 表示模糊检索，如检索拼写类似于” roam”的项这样写： roam~将找到形如foam和roams的单词； roam~0.8，检索返回相似度在0.8以上的记录。
5. 邻近检索，如检索相隔10个单词的” apache”和” jakarta”，” jakarta apache” ~10
6. “ ^” 控制相关度检索，如检索jakarta apache，同时希望去让” jakarta”的相关度更加好，那么在其后加上”^”符号和增量值，即jakarta^4 apache
7. 布尔操作符AND、 ||
8. 布尔操作符OR、 &&
9. 布尔操作符NOT、 !、 - （排除操作符不能单独与项使用构成查询）
10.“ +” 存在操作符，要求符号” +”后的项必须在文档相应的域中存在
11. ( ) 用于构成子查询
12. [] 包含范围检索，如检索某时间段记录，包含头尾， date:[200707 TO 200710]
13. {} 不包含范围检索，如检索某时间段记录，不包含头尾 date:{200707 TO 200710} 注：范围检索字段只适用于:String,int,dobule,date不能用于long型的字段
14. \ 转义操作符，特殊字符包括+ - && || ! ( ) { } [ ] ^ ” ~ * ? : \

3 字段增加权重

在很多时候，我们可能会需要增加某一个字段的权重，以合理的显示搜索结果。
例如：有一个schma，有三个字段： chapterId, title, content. 我们希望某一个关键字如果在title中匹配了，就要优先显示，而在content中匹配了，就放在搜索结果的后面。当然，如果两者同时匹配当然没什么好说的了。看看solr中如何做到吧。
title:(test1 test2)^4 content:(test1 test2)
给title字段增加权重，优先匹配,关于^后面的数字4，经过我测试，最佳值应该是有n个字段就写成n+1，当然希望大家能更好的去测试！

4 facet 字段分组

http://wiki.apache.org/solr/SimpleFacetParameters

1.facet.field  

分组的字段

2.facet.prefix 

表示Facet字段前缀

3.facet.limit 

Facet字段返回条数

4.facet.offset

开始条数,偏移量,它与facet.limit配合使用可以达到分页的效果

5.facet.mincount 

Facet字段最小count,默认为0

6.facet.missing 

如果为on或true,那么将统计那些Facet字段值为null的记录

7.facet.method 

取值为enum或fc,默认为fc, fc表示Field Cache

8.facet.enum.cache.minDf 

当facet.method=enum时,参数起作用,文档内出现某个关键字的最少次数

4.1 JSON Facet API (solr 5.1)

http://yonik.com/json-facet-api/

Count Distinct in Solr (实现对某个字段进行Distinct 的统计)

$ curl http://localhost:8983/solr/techproducts/query -d '
q=*:*&
json.facet={
  x : "unique(manu_exact)"    // manu_exact is the manufacturer indexed as a single string
}

posted @ 2015-06-13 17:16 ZhanHengZong 阅读(1340) 评论(0) 编辑收藏举报

刷新页面返回顶部

Mr.Z

solr 重要的知识点