solr学习(1)

1 .Solr是一个基于Lucene java库的企业级搜索服务器,本文记录了solr的安装过程,版本为的1.4.1。 

   从solr的官网http://lucene.apache.org/solr/
   解开下载的apache-solr-1.4.1.zip或apache-solr-1.4.1.tgz文件到apache-solr-1.4.1目录.

2. 简单运行

   1. cd apache-solr-1.4.1/example 
   2. java -jar start.jar 
   3. 打开浏览器访问 access http://localhost:8983/solr/admin/ 

    如果可以看到solr的搜索页面,说明solr正常运行。

3. 配置到tomcat

   3.1 下载tomcat,并配置

          可能需要修改端口号

    3.2 从上面解压好的solr发布包中找到example\solr目录,这个目录可以用来作为配置solr的模板使用 
         将example\solr目录复制到其他路径,如C:\soft\solr,以后这个目录就将作为solr home使用 
         注意有个文件需要修改一下,$SOLR_HOME/conf/solrconfig.xml,找到dataDir设置: 
         默认为<dataDir>${solr.data.dir:./solr}</dataDir>,用的是相对路径,这个需要修改为完整路径: 
         <dataDir>${solr.data.dir:C:\soft\solr\data}</dataDir> 
    3.3 从上面解压好的solr发布包中找到solr的war包 
          apache-solr-1.4.1/dist/apache-solr-1.4.1.war 

          可以将这个war复制到solr home目录下

    3.4  增加tomcat\conf\Catalina\localhost\solr.xml文件 

    内容为: 

     <?xml version="1.0" encoding="utf-8"?> 
     <Context docBase="C:\soft\solr\apache-solr-1.4.1.war" debug="0" crossContext="true"> 
     <Environment name="solr/home" type="java.lang.String" value="C:\soft\solr" override="true"/> 
      </Context> 

    3.5 启动tomcat 

     如果可以看到solr的搜索页面,说明solr 配置在tomcat中并且正常运行。

  4. 装在示例数据

    

    Solr有一些示例数据和装载脚本,在example/exampledocs下。

   cd 进入example/exampledoce下,输入:

    java -jar post.jar *.xml (如果在unix环境下,就运行post.sh)

    post.jar是一个简单的程序,会遍历所有的参数,然后对本机正运行的Solr(example)服务器的默认配置(http://localhost:8983/solr/update )

   发送post请求(HTTP)。这里可以看下post.sh,就可以了解在干什么了。

   下图为: java -jar post.jar *.xml的执行结果,注意,要开着 服务器

   

5. 简单的搜索

    管理员界面中,点击search按钮,得到一些xml文档:

  

This XML file does not appear to have any style information associated with it. The document tree is shown below.
<response>
<lst name="responseHeader">
<int name="status">0</int>
<int name="QTime">2</int>
<lst name="params">
<str name="indent">on</str>
<str name="start">0</str>
<str name="q">solr</str>
<str name="version">2.2</str>
<str name="rows">10</str>
</lst>
</lst>
<result name="response" numFound="1" start="0">
<doc>
<arr name="cat">
<str>software</str>
<str>search</str>
</arr>
<arr name="features">
<str>
Advanced Full-Text Search Capabilities using Lucene
</str>
<str>Optimized for High Volume Web Traffic</str>
<str>Standards Based Open Interfaces - XML and HTTP</str>
<str>Comprehensive HTML Administration Interfaces</str>
<str>
Scalability - Efficient Replication to other Solr Search Servers
</str>
<str>
Flexible and Adaptable with XML configuration and Schema
</str>
<str>
Good unicode support: héllo (hello with an accent over the e)
</str>
</arr>
<str name="id">SOLR1000</str>
<bool name="inStock">true</bool>
<date name="incubationdate_dt">2006-01-17T00:00:00Z</date>
<str name="manu">Apache Software Foundation</str>
<str name="name">Solr, the Enterprise Search Server</str>
<int name="popularity">10</int>
<float name="price">0.0</float>
</doc>
</result>
</response>

    

6. 总结

  第一次看到 solr,感觉挺好用的,至少比nutch号配置的多,不知道算不算入门了

posted @ 2011-07-16 20:53  wtx  阅读(2108)  评论(0编辑  收藏  举报