solr的基本使用
Solr
概念:
1. 搜索引擎的技术,建立在Lucene之上,可以解决跨平台,跨语言的问题.(Lucene本身是个jar包,也就是API,不能独立运行,需要程序的调用来完成全局检索,不具备跨平台,跨语言).
2. 基于Lucene的全文检索服务,是可以独立运行的(war包,运行在tomcat).
solr安装
1. 解压新的tomcat
2. 将solr进行解压
3. 找到solr.war:
* D:\develop\lucene\solr\solr-4.10.3\dist 下,自己的解压目录
* D:\develop\lucene\solr\solr-4.10.3\example\webapps 下也有
4. 将war包放在tomcat的webapps下
5. 启动tomcat,解压war包,关闭tomcat
6. 将D:\develop\lucene\solr\solr-4.10.3\example下有个solr文件夹,将该文件夹拷贝到D盘根目录(习惯)
* solrHome: 是solr运行的主目录
* solrCore: 类似于数据库,可以单独对外提供索引和搜索的服务
* 一个solrHome下包含多个solrCore
7. 在tomcat的webapps下的solr的解压文件夹下的WEB-INF下的web.xml,进行修改:
第41到45行(修改<env-entry-value>的目录为第六步复制后的那个目录):
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>D:\solr</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
8. 复制扩展包:
D:\develop\lucene\solr\solr-4.10.3\example\lib\ext目录下的所有包复制到tomcat的webapps下的solr下的WEB-INF下的lib下,然后可以启动tomcat,在网页进行访问 localhost:8080/solr
中文分析器IK Analyzer
1. 为什么要使用IK呢?
因为solr是由外国人研发,对汉语的分词是一个汉字一个汉字分的,所以引入IK,对中文有很好的分词效果,并且可以自定义扩充分词词典
2. 安装IK
1. 解压IK Analyzer 2012FF_hf1.zip
2. 将解压目录下的IKAnalyzer2012FF_u1.jar放在tomcat下的webapps下的solr下的WEB-INF下的lib下
3. 拷贝解压目录下的IKAnalyzer.cfg.xml,ext_stopword.dic,mydict.dic放在tomcat下的webapps下的solr下的WEB-INF下的classes下,classes不存在创建一个就好
4. 到前面安装solr时的那个solrhome下,修改collection1\conf\schema.xml,在1152行添加:
<fieldType name="text_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
5. 选择分词的时候选择text_ik,就可以使用中文分析器了.(笔者第一次就是选择text,一直失败,谨此注意一下)
配置域:
1. 域是针对当前项目而言的
* 需要根据什么样的条件进行查询
* 查询出来的记过需要展示的数据信息
* 需要用到的字段
2. 使用solr进行索引创建,所指定的域 必须在schema.xml中存在,否则会创建失败.
3. 关于域的属性:
* name: 所指定域的名称
* type: 域的类型-----> 引用filedType中的name属性(是否分词)---->为了索引
* indexed: 是否索引----> 为了搜索
* stored: 是否存储----> 为了展示
* required: 是否必须
* multiValued: 是否多值
4. 针对本项目,修改schema.xml文件,在</schema>之前添加:
<field name="item_goodsid" type="long" indexed="true" stored="true"/>
<field name="item_title" type="text_ik" indexed="true" stored="true"/>
<field name="item_price" type="double" indexed="true" stored="true"/>
<field name="item_image" type="string" indexed="false" stored="true" />
<field name="item_category" type="string" indexed="true" stored="true" />
<field name="item_seller" type="text_ik" indexed="true" stored="true" />
<field name="item_brand" type="string" indexed="true" stored="true" />
5. 复制域(多个字段进行搜索):
<field name="item_keywords" type="text_ik" indexed="true" stored="false"
multiValued="true"/>
6. 动态域(通配)
7. 主键:
SolrJ(原理: http请求和响应)
Solr官方提供的API(理解)
SpringDataSolr(对SolrJ的封装)
1. 引入依赖:
<dependencies>
<dependency>
<groupId>org.springframework.data</groupId>
<artifactId>spring-data-solr</artifactId>
<version>1.5.5.RELEASE</version>
</dependency>
<dependency>
<groupId>org.springframework</groupId>
<artifactId>spring-test</artifactId>
<version>4.2.4.RELEASE</version>
</dependency>
<dependency>
<groupId>junit</groupId>
<artifactId>junit</artifactId>
<version>4.9</version>
</dependency>
</dependencies>
2. 基本的操作:
package springdatasolr;
import com.wzlove.pojo.TbItem;
import org.apache.solr.client.solrj.response.UpdateResponse;
import org.apache.solr.common.SolrInputDocument;
import org.junit.Test;
import org.junit.runner.RunWith;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.data.solr.core.SolrTemplate;
import org.springframework.data.solr.core.query.Criteria;
import org.springframework.data.solr.core.query.Query;
import org.springframework.data.solr.core.query.SimpleQuery;
import org.springframework.data.solr.core.query.result.ScoredPage;
import org.springframework.test.context.ContextConfiguration;
import org.springframework.test.context.junit4.SpringJUnit4ClassRunner;
import java.math.BigDecimal;
import java.util.ArrayList;
import java.util.List;
/**
* @ClassName SpringDataSolrDemo
* @Author wz157
* @Date 2018/11/8 15:22
* @Description TODO
*/
@RunWith(SpringJUnit4ClassRunner.class)
@ContextConfiguration({"classpath:applicationContext-solr.xml"})
public class SpringDataSolrDemo {
// 注入SolrTemplate
@Autowired
private SolrTemplate solrTemplate;
/**
* 测试添加索引
*/
@Test
public void testAdd(){
TbItem item = new TbItem();
item.setId(1L);
item.setBrand("华为");
item.setCategory("手机");
item.setGoodsId(1L);
item.setSeller("华为2号专卖店");
item.setTitle("华为 Mate9");
item.setPrice(new BigDecimal(2000));
solrTemplate.saveBean(item);
solrTemplate.commit();
}
/**
* 根据主键进行查询,getById()
*/
@Test
public void findByUniqueKey(){
TbItem byId = solrTemplate.getById(1, TbItem.class);
System.out.println(byId);
}
/**
* 根据主键进行删除,deleteById() 记得传字节码文件
*/
@Test
public void deleteByUniqueKey(){
solrTemplate.deleteById("1");
// 提交
solrTemplate.commit();
}
/**
* 批量插入,saveBeans
*/
@Test
public void testAddList(){
List<TbItem> list = new ArrayList<TbItem>(100);
for (int i = 0; i < 100; i++) {
TbItem item = new TbItem();
item.setId(i + 1L);
item.setBrand("华为" + i);
item.setCategory("手机");
item.setGoodsId(1L);
item.setSeller("华为2号专卖店" + i);
item.setTitle("华为 Mate9" + i );
item.setPrice(new BigDecimal(2000 + i));
list.add(item);
}
solrTemplate.saveBeans(list);
solrTemplate.commit();
}
/**
* 分页查询(总页数,总记录数)
* offset 开始索引
* rows 每页记录数
*/
@Test
public void testQueryByPage(){
// 创建查询条件,查询所有使用 *:*
Query query = new SimpleQuery("*:*");
// 设置分页条件
query.setOffset(2);
query.setRows(5);
// 执行分页查询
ScoredPage<TbItem> tbItems = solrTemplate.queryForPage(query, TbItem.class);
// 解析分页结果
for (TbItem tbItem : tbItems) {
System.out.println(tbItem.getBrand());
System.out.println(tbItem.getPrice());
}
System.out.println("总记录的数 : " + tbItems.getTotalElements());
System.out.println("总页数 : " + tbItems.getTotalPages());
}
/**
* 条件查询
*/
@Test
public void testPageQueryMutil(){
// 创建查询条件,查询所有使用 *:*
Query query = new SimpleQuery("*:*");
// 设置查询条件(Criterial)
Criteria criteria = new Criteria("item_brand").contains("2");
criteria = criteria.and("item_seller").contains("2");
query.addCriteria(criteria);
// 执行分页查询
ScoredPage<TbItem> tbItems = solrTemplate.queryForPage(query, TbItem.class);
// 解析分页结果
for (TbItem tbItem : tbItems) {
System.out.println(tbItem.getBrand() + " " + tbItem.getPrice() + " " + tbItem.getSeller());
}
System.out.println("总记录的数 : " + tbItems.getTotalElements());
System.out.println("总页数 : " + tbItems.getTotalPages());
}
/**
* 全部删除
*/
@Test
public void testDeleteAll(){
Query query = new SimpleQuery("*:*");
solrTemplate.delete(query);
solrTemplate.commit();
}
}
3. 配置文件:
<?xml version="1.0" encoding="UTF-8"?>
<beans xmlns="http://www.springframework.org/schema/beans"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns:p="http://www.springframework.org/schema/p"
xmlns:context="http://www.springframework.org/schema/context"
xmlns:solr="http://www.springframework.org/schema/data/solr"
xsi:schemaLocation="http://www.springframework.org/schema/data/solr
http://www.springframework.org/schema/data/solr/spring-solr-1.0.xsd
http://www.springframework.org/schema/beans
http://www.springframework.org/schema/beans/spring-beans.xsd
http://www.springframework.org/schema/context
http://www.springframework.org/schema/context/spring-context.xsd">
<!-- solr 服务器地址,相当于配置了HttpSolrServer这个bean -->
<solr:solr-server id="solrServer" url="http://127.0.0.1:8080/solr/collection1" />
<!-- solr 模板,使用 solr 模板可对索引库进行 CRUD 的操作 -->
<bean id="solrTemplate" class="org.springframework.data.solr.core.SolrTemplate">
<constructor-arg ref="solrServer" />
</bean>
</beans>
4. 实体:
public class TbItem implements Serializable {
@Field
private Long id;
@Field("item_title")
private String title;
@Field("item_price")
private BigDecimal price;
@Field("item_image")
private String image;
@Field("item_goodsid")
private Long goodsId;
@Field("item_category")
private String category;
@Field("item_brand")
private String brand;
@Field("item_seller")
private String seller;
get和set
@Override
public String toString() {
return "TbItem{" +
"id=" + id +
", title='" + title + '\'' +
", sellPoint='" + sellPoint + '\'' +
", price=" + price +
", stockCount=" + stockCount +
", num=" + num +
", barcode='" + barcode + '\'' +
", image='" + image + '\'' +
", categoryid=" + categoryid +
", status='" + status + '\'' +
", createTime=" + createTime +
", updateTime=" + updateTime +
", itemSn='" + itemSn + '\'' +
", costPirce=" + costPirce +
", marketPrice=" + marketPrice +
", isDefault='" + isDefault + '\'' +
", goodsId=" + goodsId +
", sellerId='" + sellerId + '\'' +
", cartThumbnail='" + cartThumbnail + '\'' +
", category='" + category + '\'' +
", brand='" + brand + '\'' +
", spec='" + spec + '\'' +
", seller='" + seller + '\'' +
'}';
}
}
5. 需要注意的是在solr库的schema约束中配置域