solr学习(1)
1 .Solr是一个基于Lucene java库的企业级搜索服务器,本文记录了solr的安装过程,版本为的1.4.1。
从solr的官网http://lucene.apache.org/solr/
解开下载的apache-solr-1.4.1.zip或apache-solr-1.4.1.tgz文件到apache-solr-1.4.1目录.
2. 简单运行
1. cd apache-solr-1.4.1/example
2. java -jar start.jar
3. 打开浏览器访问 access http://localhost:8983/solr/admin/
如果可以看到solr的搜索页面,说明solr正常运行。
3. 配置到tomcat
3.1 下载tomcat,并配置
可能需要修改端口号
3.2 从上面解压好的solr发布包中找到example\solr目录,这个目录可以用来作为配置solr的模板使用
将example\solr目录复制到其他路径,如C:\soft\solr,以后这个目录就将作为solr home使用
注意有个文件需要修改一下,$SOLR_HOME/conf/solrconfig.xml,找到dataDir设置:
默认为<dataDir>${solr.data.dir:./solr}</dataDir>,用的是相对路径,这个需要修改为完整路径:
<dataDir>${solr.data.dir:C:\soft\solr\data}</dataDir>
3.3 从上面解压好的solr发布包中找到solr的war包
apache-solr-1.4.1/dist/apache-solr-1.4.1.war
可以将这个war复制到solr home目录下
3.4 增加tomcat\conf\Catalina\localhost\solr.xml文件
内容为:
<?xml version="1.0" encoding="utf-8"?>
<Context docBase="C:\soft\solr\apache-solr-1.4.1.war" debug="0" crossContext="true">
<Environment name="solr/home" type="java.lang.String" value="C:\soft\solr" override="true"/>
</Context>
3.5 启动tomcat
如果可以看到solr的搜索页面,说明solr 配置在tomcat中并且正常运行。
4. 装在示例数据
Solr有一些示例数据和装载脚本,在example/exampledocs下。
cd 进入example/exampledoce下,输入:
java -jar post.jar *.xml (如果在unix环境下,就运行post.sh)
post.jar是一个简单的程序,会遍历所有的参数,然后对本机正运行的Solr(example)服务器的默认配置(http://localhost:8983/solr/update )
发送post请求(HTTP)。这里可以看下post.sh,就可以了解在干什么了。
下图为: java -jar post.jar *.xml的执行结果,注意,要开着 服务器
5. 简单的搜索
管理员界面中,点击search按钮,得到一些xml文档:
This XML file does not appear to have any style information associated with it. The document tree is shown below. <response> <lst name="responseHeader"> <int name="status">0</int> <int name="QTime">2</int> <lst name="params"> <str name="indent">on</str> <str name="start">0</str> <str name="q">solr</str> <str name="version">2.2</str> <str name="rows">10</str> </lst> </lst> <result name="response" numFound="1" start="0"> <doc> <arr name="cat"> <str>software</str> <str>search</str> </arr> <arr name="features"> <str> Advanced Full-Text Search Capabilities using Lucene </str> <str>Optimized for High Volume Web Traffic</str> <str>Standards Based Open Interfaces - XML and HTTP</str> <str>Comprehensive HTML Administration Interfaces</str> <str> Scalability - Efficient Replication to other Solr Search Servers </str> <str> Flexible and Adaptable with XML configuration and Schema </str> <str> Good unicode support: héllo (hello with an accent over the e) </str> </arr> <str name="id">SOLR1000</str> <bool name="inStock">true</bool> <date name="incubationdate_dt">2006-01-17T00:00:00Z</date> <str name="manu">Apache Software Foundation</str> <str name="name">Solr, the Enterprise Search Server</str> <int name="popularity">10</int> <float name="price">0.0</float> </doc> </result> </response>
6. 总结
第一次看到 solr,感觉挺好用的,至少比nutch号配置的多,不知道算不算入门了