全文检索 - 随笔分类 - 纶巾客

Solr的Scala客户端（scalikesolr）介绍

摘要：本文是scalikesolr的wiki的翻译后边的代码片段使用了如下文档产生的索引"example/exampledocs/books.json".{ "id" : "978-0641723445", "cat" : ["book","hardcover"], "title" : "The Lightning Thief", "author" : "Rick Riordan", "ser 阅读全文

posted @ 2013-01-21 23:04 纶巾客阅读(1904) 评论(2) 推荐(1) 编辑

使用Solr构建企业级的全文检索（四）---------写入文档

摘要：前一篇文章介绍了如何定义Solr的Schema，有了数据的结构定义，下来我们就来看看如何写入数据吧。将文档数据写入到Solr有很多种方式, 你可以使用xml文档，json文档，csv文档，对于这三种方式，你可以在Linux下使用curl方便的导入数据，比如使用xml文档，你可以这样写：添加xml文档 curl http://localhost:8983/solr/update?commit=true -H "Content-Type: text/xml" --data-binary '<add><doc><field name=&q 阅读全文

posted @ 2012-01-04 22:14 纶巾客阅读(3754) 评论(0) 推荐(2) 编辑

使用Solr构建企业级的全文检索（三）---------Schema定义

摘要：上一篇文章介绍了Solr的管理界面，使用这个管理界面我们我们可以方便的了解现在Solr的运行情况，也可以查看目前的系统是如何配置的，你甚至可以通过它做一些测试和调试，但是也仅止于此，系统的配置你还必须通过各种各样的配置文件。要使Solr可以处理我们自己的文档，第一步要做的就是配置Schema。Schema是Solr业务逻辑的核心，一个文档包含哪些字段，字段是否被索引，如何索引，如何被查询都在Schema中定义。我们可以在Solr的conf目录下找到schema.xml这个文件，这个文件中就是Schema的定义。需要注意的是一个Solr的实例只能有一个Schema。Schema的定义很像是数.. 阅读全文

posted @ 2011-12-12 22:22 纶巾客阅读(4226) 评论(0) 推荐(1) 编辑

使用Solr构建企业级的全文检索（二）---------管理界面简介

摘要：昨天这个系列开篇了，今天就趁热打铁吧。有一点要注意的是，一开始我是在64位的Windows 7上的Tomcat中部署Solr的，在使用过程中发现非常的不稳定，经常添加两个文档或者是查询一两次后，tomcat就崩溃了，让我对Solr的稳定性很是担忧，又来部署到虚拟机中的CentOS上，非常的稳定又高效。在Windows 7上为什么不稳定，我没有去分析，可能是因为各个组件的版本间的问题吧。如果哪位同学希望在Tomcat中部署Solr，请参考《Solr with Apache Tomcat》或者《在tomcat上部署solr 》。如果使用Tomcat，一定不要忘记在server.xml文件中con. 阅读全文

posted @ 2011-12-08 23:16 纶巾客阅读(5193) 评论(3) 推荐(1) 编辑

使用Solr构建企业级的全文检索（一）---------开篇

摘要：换了个工作单位，也就换了从事的项目的业务类型。新的项目中要需要使用全文检索功能，由于项目是基于SQL server的应用，所以旧的设计也就使用了SQL server的Full-text Search Engine来实现全文检索功能。在使用SQL server 的全文检索功能的过程中，发现有很多的问题不能很好的解决，比如Cache,一般来说，对于SQL server的缓存也就是执行计划的缓存和查询结果的页面缓存，远远不够，而且也很难根据自己的业务需要去调整缓存的参数。另外对于多语言的分词算法问题，SQL server虽然内置了50多种语言的支持，但是都不够完美，如果自己想要进行替换，应该是很困难阅读全文

posted @ 2011-12-07 23:13 纶巾客阅读(3579) 评论(4) 推荐(1) 编辑

白话Programming

随笔分类 - 全文检索

公告