solr
目标:
solr的概念
solr服务器的搭建和使用
solr中导入数据库数据
项目中怎么使用solr实现商品搜索功能
一.solr相关概念
1.1 什么是Solr?
solr是一个独立的企业级搜索应用服务器,它是对外提供类似于web-service的api接口,用户可以通过http请求,发送一定格式的xml数据到solr,生成索引,也可以发送http get请求,请求solr服务器查询数据,将查询出的数据也是以xml格式返回.
1.2.为什么要用solr?
1.数据库的模糊查询没有分词的功能,solr有,可以更有效的查询到我们需要的数据
2.从solr 服务器中查询数据会比从数据库查询速度要快.
1.3.solr的工作方式
文档通过Http利用XML 加到一个搜索集合中。Solr查询该集合也是通过http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。
1.4. solr特点
1.高级全文搜索能力:由Lucene 提供支持,Solr可实现强大的匹配功能,包括短语,通配符,联接,分组以及任何数据类型 .
2.拥有基于标准的开放式接口- XML、JSON 和 HTTP
3.综合的管理界面
4.高度的可扩展性和容错性
5.能够实时索引
6.可扩展的插件架构,Solr可以和Hadoop一起使用。由于Hadoop处理大量数据,Solr帮助我们从这么大的源中找到所需的信息。不仅限于搜索,Solr也可以用于存储目的。像其他NoSQL数据库一样,它是一种非关系数据存储和处理技术。
1.5.solr版本和jdk需求关系
版本 发布时间 说明
1.1 2007-01-18 -
....
4.0.0 2013-01-16 Java 1.6 以上,ZooKeeper 3.3.6;引入solrcloud
....
4.7.1 2014-04-01 Java 1.6 以上,最后一个采用旧版配置方法版本
4.8.0 2014-04-27 Java 1.7 以上,ZooKeeper 3.4.6
....
6.0.0 2016-04-07 Java 1.8 以上,Jetty 9.3.8
.....
1.6. Solr 相关链接
Solr 各版本下载地址:http://archive.apache.org/dist/lucene/solr/
Solr 官方网站:http://lucene.apache.org/solr/resources.html
详细的solr中文手册链接:https://www.w3cschool.cn/solr_doc/
二.solr的安装
2.1 下载jar 7.6.0
2.2 解压
解压出来的文件目录
2.3 启动服务器
2.4访问
三 创建core
在solr中,每一个core代表一个索引库,里面保存索引数据以及配置信息
solr中可以有多个core,也就相当于mysql服务器下可以多个数据库
3.1 方法1: 用命令创建
- solr create -c core名称
- core的存放路径
3.2 方法2:界面创建
1.在solr-7.6.0/server/solr 文件夹下创建一个core文件夹 ,取名为students(商城项目里取名为goods)
-
将C:\solr-7.6.0\server\solr\configsets\_default下的conf文件复制一份到students(或goods)文件夹下
3.在solr界面Add Core,(之前取名goods的 这里名字就为goods)
四. 添加中文分词
选择刚才创建的core,点击Analysis进入分词分析页面,输入要分词的句子,选择分词库,点击分析按钮,即可看到分词结果
solr默认不支持中文分词
4.1测试自带的中文分词(商城项目配置 跳过这一步 直接用后面的ik分词器)
4.1.1 添加中文分词插件
solr 7.6中自带中文分词插件,将solr-7.6.0\contrib\analysis-extras\lucene-libs\lucene-analyzers-smartcn-7.6.0.jar 复制到 solr-7.6.0\server\solr-webapp\webapp\WEB-INF\lib 目录中
4.1.2配置中文分词
修改 solr-7.6.0\server\solr\articles【创建的core的名称】\conf\managed-schema文件
添加我们的中文配置【在eclipse/idea等工具里打开,记事本打开容易出现编码问题】
<!-- Chinese -->
<fieldType name="text_cn" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
</fieldType>
4.1.3重启solr,测试中文分词
solr restart -p 8983
4.2 测试中文分词起ik-analyzer
4.2.1 下载ik-analyzer-7.6.0.jar包
并添加到solr-7.6.0\server\solr-webapp\webapp\WEB-INF\lib 目录中
4.2.2 在创建的core里的配置文件managed-schema.xml中添加
<!-- ik分词器 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
4.2.3 重启服务器, 测试
solr restart -p 8983
五.导入数据库中数据
- 将数据库jar包(在发你们的solr资料文件里)
和solr-7.6.0\dist下的dataimporthandler-7.6.0架包 (注意是mysql驱动和dataimport两个jar包)复制到 C:\solr-7.6.0\server\solr-webapp\webapp\WEB-INF\lib
- 创建data-config.xml文件
goods/conf文件夹下创建mysql-db文件夹,然后在mysql-db文件夹中创建data-config.xml文件,文件中添加如下内容
<?xml version="1.0" encoding="utf-8" ?>
<dataConfig>
<dataSource type="JdbcDataSource"
driver="com.mysql.jdbc.Driver"
url="jdbc:mysql://localhost:3306/sc"
user="root"
password="root"
/>
<document>
<entity name="goods" query="select goods_id,goods_name,sales_price,goods_img,cid from goods">
<field column="goods_id" name="id" />
<field column="goods_name" name="goodsName" />
<field column="sales_price" name="salesPrice" />
<field column="goods_img" name="goodsImg" />
<field column="cid" name="cid" />
</entity>
</document>
</dataConfig>
-
添加document中的字段
在managed-schema.xml文件中添加
注意: id,version,root 不能删除
_text_ 不需要 可以删除
```
<field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" />
<!-- docValues are enabled by default for long type so we don't need to index the version field -->
<field name="_version_" type="plong" indexed="false" stored="false"/>
<field name="_root_" type="string" indexed="true" stored="false" docValues="false" />
<field name="goodsName" type="text_ik" indexed="true" stored="true" multiValued="false" />
<field name="salesPrice" type="plong" indexed="true" stored="true" multiValued="false" />
<field name="goodsImg" type="string" indexed="true" stored="true" multiValued="false" />
<field name="cid" type="string" indexed="true" stored="true" multiValued="false" />
```
-
导入data-config.xml文件
在solrconfig.xml文件中添加
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"> <lst name="defaults"> <str name="config">mysql-db/data-config.xml</str> </lst> </requestHandler>
-
重启solr
-
导入数据
-
-
测试查询
六. ssm中使用solr
-
添加jar包
<!-- solr jar包 --> <dependency> <groupId>org.apache.solr</groupId> <artifactId>solr-solrj</artifactId> <version>7.6.0</version> </dependency>
-
在spring.xml中配置
<!-- 配置solr客户端对象 --> <bean id="httpSolrClient" class="org.apache.solr.client.solrj.impl.HttpSolrClient"> <constructor-arg name="builder" value="http://localhost:8983/solr/goods" /> </bean>
-
修改pojo中goods类
-
控制层写solr查询操作
@RequestMapping("showGoodsByWhere2") public String search2(@RequestParam(name = "pageIndex",defaultValue = "1") int pageIndex, int cid,@RequestParam(name = "keyword",defaultValue = "西") String keyword) throws IOException, SolrServerException { //创建一个query对象 SolrQuery solrQuery=new SolrQuery(); //设置默认的查询范围 solrQuery.set("df", "goodsName"); //设置查询条件 solrQuery.setQuery(keyword+"*"); //设置过滤条件 solrQuery.setFilterQueries("cid:"+cid); //设置排序条件 solrQuery.setSort("goodsPrice",ORDER.desc); solrQuery.addField("id"); solrQuery.addField("goodsName"); solrQuery.addField("salesPrice"); solrQuery.addField("goodsImg"); //solrQuery.addField("cid"); solrQuery.setStart(0); //每页显示多少行 solrQuery.setRows(2); //设置高亮(开启) solrQuery.setHighlight(true); //设置高亮域 solrQuery.addHighlightField("goodsName"); //设置高亮前缀 solrQuery.setHighlightSimplePre("<em>"); //设置高亮后缀 solrQuery.setHighlightSimplePost("</em>"); // 创建组合条件串 // StringBuilder params = new StringBuilder("cid:" + cid); // params.append(" and goodsName:"+keyword); // solrQuery.setQuery(params.toString()); //将查询对象传递到服务器端 QueryResponse queryResponse= httpSolrClient.query(solrQuery); httpSolrClient.commit(); List<Goods> list= queryResponse.getBeans(Goods.class); System.out.println(list.toString()); // ModelAndView modelAndView=new ModelAndView(); //modelAndView.addObject("goodsList",list); // modelAndView.setViewName("searchList"); //return modelAndView; return "success"; }