solr学习(1)
1 .Solr是一个基于Lucene java库的企业级搜索服务器,本文记录了solr的安装过程,版本为的1.4.1。
从solr的官网http://lucene.apache.org/solr/
解开下载的apache-solr-1.4.1.zip或apache-solr-1.4.1.tgz文件到apache-solr-1.4.1目录.
2. 简单运行
1. cd apache-solr-1.4.1/example
2. java -jar start.jar
3. 打开浏览器访问 access http://localhost:8983/solr/admin/
如果可以看到solr的搜索页面,说明solr正常运行。
3. 配置到tomcat
3.1 下载tomcat,并配置
可能需要修改端口号
3.2 从上面解压好的solr发布包中找到example\solr目录,这个目录可以用来作为配置solr的模板使用
将example\solr目录复制到其他路径,如C:\soft\solr,以后这个目录就将作为solr home使用
注意有个文件需要修改一下,$SOLR_HOME/conf/solrconfig.xml,找到dataDir设置:
默认为<dataDir>${solr.data.dir:./solr}</dataDir>,用的是相对路径,这个需要修改为完整路径:
<dataDir>${solr.data.dir:C:\soft\solr\data}</dataDir>
3.3 从上面解压好的solr发布包中找到solr的war包
apache-solr-1.4.1/dist/apache-solr-1.4.1.war
可以将这个war复制到solr home目录下
3.4 增加tomcat\conf\Catalina\localhost\solr.xml文件
内容为:
<?xml version="1.0" encoding="utf-8"?>
<Context docBase="C:\soft\solr\apache-solr-1.4.1.war" debug="0" crossContext="true">
<Environment name="solr/home" type="java.lang.String" value="C:\soft\solr" override="true"/>
</Context>
3.5 启动tomcat
如果可以看到solr的搜索页面,说明solr 配置在tomcat中并且正常运行。
4. 装在示例数据
Solr有一些示例数据和装载脚本,在example/exampledocs下。
cd 进入example/exampledoce下,输入:
java -jar post.jar *.xml (如果在unix环境下,就运行post.sh)
post.jar是一个简单的程序,会遍历所有的参数,然后对本机正运行的Solr(example)服务器的默认配置(http://localhost:8983/solr/update )
发送post请求(HTTP)。这里可以看下post.sh,就可以了解在干什么了。
下图为: java -jar post.jar *.xml的执行结果,注意,要开着 服务器
5. 简单的搜索
管理员界面中,点击search按钮,得到一些xml文档:
This XML file does not appear to have any style information associated with it. The document tree is shown below. < response > < lst name="responseHeader"> < int name="status">0</ int > < int name="QTime">2</ int > < lst name="params"> < str name="indent">on</ str > < str name="start">0</ str > < str name="q">solr</ str > < str name="version">2.2</ str > < str name="rows">10</ str > </ lst > </ lst > < result name="response" numFound="1" start="0"> < doc > < arr name="cat"> < str >software</ str > < str >search</ str > </ arr > < arr name="features"> < str > Advanced Full-Text Search Capabilities using Lucene </ str > < str >Optimized for High Volume Web Traffic</ str > < str >Standards Based Open Interfaces - XML and HTTP</ str > < str >Comprehensive HTML Administration Interfaces</ str > < str > Scalability - Efficient Replication to other Solr Search Servers </ str > < str > Flexible and Adaptable with XML configuration and Schema </ str > < str > Good unicode support: héllo (hello with an accent over the e) </ str > </ arr > < str name="id">SOLR1000</ str > < bool name="inStock">true</ bool > < date name="incubationdate_dt">2006-01-17T00:00:00Z</ date > < str name="manu">Apache Software Foundation</ str > < str name="name">Solr, the Enterprise Search Server</ str > < int name="popularity">10</ int > < float name="price">0.0</ float > </ doc > </ result > </ response > |
6. 总结
第一次看到 solr,感觉挺好用的,至少比nutch号配置的多,不知道算不算入门了
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· .NET周刊【3月第1期 2025-03-02】
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· [AI/GPT/综述] AI Agent的设计模式综述