随笔分类 -  全文检索

全文检索
摘要:本文是scalikesolr的wiki的翻译后边的代码片段使用了如下文档产生的索引"example/exampledocs/books.json".{ "id" : "978-0641723445", "cat" : ["book","hardcover"], "title" : "The Lightning Thief", "author" : "Rick Riordan", "ser 阅读全文
posted @ 2013-01-21 23:04 纶巾客 阅读(1904) 评论(2) 推荐(1) 编辑
摘要:前一篇文章介绍了如何定义Solr的Schema,有了数据的结构定义,下来我们就来看看如何写入数据吧。 将文档数据写入到Solr有很多种方式, 你可以使用xml文档,json文档,csv文档,对于这三种方式,你可以在Linux下使用curl方便的导入数据,比如使用xml文档,你可以这样写: 添加xml文档 curl http://localhost:8983/solr/update?commit=true -H "Content-Type: text/xml" --data-binary '<add><doc><field name=&q 阅读全文
posted @ 2012-01-04 22:14 纶巾客 阅读(3754) 评论(0) 推荐(2) 编辑
摘要:上一篇文章介绍了Solr的管理界面,使用这个管理界面我们我们可以方便的了解现在Solr的运行情况,也可以查看目前的系统是如何配置的,你甚至可以通过它做一些测试和调试,但是也仅止于此,系统的配置你还必须通过各种各样的配置文件。要使Solr可以处理我们自己的文档,第一步要做的就是配置Schema。Schema是Solr业务逻辑的核心,一个文档包含哪些字段,字段是否被索引,如何索引,如何被查询都在Schema中定义。我们可以在Solr的conf目录下找到schema.xml这个文件,这个文件中就是Schema的定义。需要注意的是一个Solr的实例只能有一个Schema。Schema的定义很像是数.. 阅读全文
posted @ 2011-12-12 22:22 纶巾客 阅读(4226) 评论(0) 推荐(1) 编辑
摘要:昨天这个系列开篇了,今天就趁热打铁吧。有一点要注意的是,一开始我是在64位的Windows 7上的Tomcat中部署Solr的,在使用过程中发现非常的不稳定,经常添加两个文档或者是查询一两次后,tomcat就崩溃了,让我对Solr的稳定性很是担忧,又来部署到虚拟机中的CentOS上,非常的稳定又高效。在Windows 7上为什么不稳定,我没有去分析,可能是因为各个组件的版本间的问题吧。如果哪位同学希望在Tomcat中部署Solr,请参考《Solr with Apache Tomcat》或者《在tomcat上部署solr 》。如果使用Tomcat,一定不要忘记在server.xml文件中con. 阅读全文
posted @ 2011-12-08 23:16 纶巾客 阅读(5193) 评论(3) 推荐(1) 编辑
摘要:换了个工作单位,也就换了从事的项目的业务类型。新的项目中要需要使用全文检索功能,由于项目是基于SQL server的应用,所以旧的设计也就使用了SQL server的Full-text Search Engine来实现全文检索功能。在使用SQL server 的全文检索功能的过程中,发现有很多的问题不能很好的解决,比如Cache,一般来说,对于SQL server的缓存也就是执行计划的缓存和查询结果的页面缓存,远远不够,而且也很难根据自己的业务需要去调整缓存的参数。另外对于多语言的分词算法问题,SQL server虽然内置了50多种语言的支持,但是都不够完美,如果自己想要进行替换,应该是很困难 阅读全文
posted @ 2011-12-07 23:13 纶巾客 阅读(3579) 评论(4) 推荐(1) 编辑