上一页 1 ··· 12 13 14 15 16 17 18 19 20 ··· 22 下一页
摘要: spellcheck 可以实现输入“错误”提示,如:输入“周杰仑”搜索时,提示:您是不是要找“周杰伦”。Lucene 有这样的功能。用 n-gram 方法和 Levenshtein distance (编辑距离,算相似度)算法实现。 原理大概:用正确的词条,以 n-gram 方法去折分,并建立索引(官方叫:dictionary index),在查询时,去查dictionary index,可以返回正确词条,于是这些词条就是“提示”。 solr 1.2 也有此功能。solr 1.3 用组件的方式实现此功能。我现用 solr 1.3 来试下。默认有spellcheck组件了(使已经配置... 阅读全文
posted @ 2009-09-16 12:15 searchDM 阅读(713) 评论(2) 推荐(0) 编辑
摘要: 昨天在用 solrj 在 solr 的子机上做索引,报错: The@DeprecatedSolrUpdateServletdoesnotacceptqueryparameters:/update?wt=javabin&amp;version=2.2Ifyouareusingsolrj,makesuretoregisterarequesthandlerto/updateratherthenusethisservlet.Add:<requestHandlername="/update"class="solr.XmlUpdateRequestHandler 阅读全文
posted @ 2009-09-16 12:14 searchDM 阅读(350) 评论(0) 推荐(0) 编辑
摘要: 有个频繁做索引的应用,它同时也对外提供搜索服务。大部分是 solr 1.3 的默认配置。solr 做索引,有时候报: 2009-7-13 9:48:06 org.apache.solr.common.SolrException log严重: org.apache.lucene.store.LockObtainFailedException: Lock obtain timed out: SingleInstanceLock: write.lock at org.apache.lucene.store.Lock.obtain(Lock.java:85) ... 阅读全文
posted @ 2009-09-16 12:13 searchDM 阅读(959) 评论(0) 推荐(0) 编辑
摘要: Solr 1.4 版(未发布)开始有 SolrReplication 的东西,它是分布式复制组件。在 Solr 1.4 以下的版本完全靠 solr.home/bin 目录下的脚本来完成子机从主机复制索引文件。造成了平台有关了(只能在 unix 类操作系统下使用)。windows 平台下基本没戏(排除自己写复制的细节)。Solr 1.4 引进 SolrReplication 非常不错,这样 windows 平台下有福了,同时还提供 HTTP 的 API,可以方便做一些复杂的处理。 Solr 1.4 主要特性: 复制不需要额外的脚本。仅仅在 solrconfig.xml 配置就行。同时... 阅读全文
posted @ 2009-09-16 12:12 searchDM 阅读(379) 评论(0) 推荐(0) 编辑
摘要: solr 1.3 中使用的 cache 是 LRUCache,可以用 memcached 实现 SolrCache,替换 solr 的默认的 LRUCache。 环境描述:有 N 台 solr 的子机(只提供搜索服务,用户搜索请求负载均衡到这些机器,N > 2),solr 默认缓存是 LRUCache。单台机的内存是有限制的,而且每台机的缓存是独立的,而请求是轮询分布到每台机上,所以缓存会有重复、且会浪费。把每台机的缓存都放到 memcached 中,每台子机共同创建缓存,并且可以分享其它机器创建的缓存,再加上 memcached 容量大,命中率会有提升。 于是,我就想用 memc... 阅读全文
posted @ 2009-09-16 12:11 searchDM 阅读(644) 评论(0) 推荐(0) 编辑
摘要: solr 的 Distributed Searching 试用 一直想了解分布搜索与索引。Lucene有MultiSearcher,solr1.2的只能有单个索引,现在1.3可以有Distributed Searching这玩意。可以从多个索引里搜索出并合并结果返回给你。这些索引不是replication的,是分割的。可以先%num方式索引在 num台机器上,然后用solr的shards参数。 如: shards=localhost:8080/use-solr1.3,localhost:9080/use-solr1.3&q=chenlb 测试... 阅读全文
posted @ 2009-09-16 12:07 searchDM 阅读(459) 评论(0) 推荐(0) 编辑
摘要: centos 配置 ssh 在VMware安装一个CentOS的Sever版,终端里的内容不可滚动,不方便。在win下远程登录不错(win下有个Xshell)。默认安装ssh是有的。只是hosts访问问题。 1.在hosts.deny文件尾添加sshd:ALL 意思是拒绝所有访问请求 [root@localhost~]#vi/etc/hosts.deny 修改后看起来如下: # #hosts.denyThisfiledescribesthenamesofthehostswhichare #*not*allowedtousetheloc... 阅读全文
posted @ 2009-09-16 12:07 searchDM 阅读(823) 评论(0) 推荐(0) 编辑
摘要: 在Unix和Linux下安装JDK及环境设置 -------------------------------------------------------------------------------- Fedora Core 3上已经成功安装了jdk(jdk-1_5_0_02-linux-i586.rpm),过程很简单: 1. 先从网上下载jdk(jdk-1_5_0_02-linux-i586.rpm.bin,jdk-1_5_0_06-linux-i586.rpm.bin也成功) ,推荐SUN的官方网站http://java.sun.com/javase/downloads/index. 阅读全文
posted @ 2009-09-16 12:06 searchDM 阅读(208) 评论(0) 推荐(0) 编辑
摘要: solr 分布式其实是分发,这概念像Mysql的复制。所有的索引的改变都在主服务器里,所有的查询都在从服务里。从服务器不断地(定时)从主服务器拉内容,以保持数据一致。先描述下我的环境:solr-master(192.168.1.181), solr-slave(192.168.1.155), jdke1.6.0_06, tomcat-5.5.26, solr-1.2tomcat_home在 /home/chenlb/tomcat-5.5.26solr_home在 /home/chenlb/solr-homesolr解压后的目录 /home/chenlb/solr-1.2.0最好两机可以ssh无 阅读全文
posted @ 2009-09-16 12:04 searchDM 阅读(672) 评论(0) 推荐(0) 编辑
摘要: Solr 涉及的术语,简单介绍下: Auto-warming(自动预热) 当打开一个新的缓存时,它把在旧缓存里命中较高的键/值添加到新的缓存里。Constraint(限制) 限制对象集的方法。Facet(层面) 对象集的一个方面或特定的一部分,这可以用来资源分类。Filter(过虑器) 它由上下方决定,可能是:1. Constraint(限制)的那称呼。2. 限制查询结果的"fq"参数。3. 涉及特定的Lucene的"Filter"类。Solr Home Dir(Solr主目录) 又叫Solr Home Directory或Solr Home,它是Sol 阅读全文
posted @ 2009-09-16 12:03 searchDM 阅读(508) 评论(0) 推荐(0) 编辑
上一页 1 ··· 12 13 14 15 16 17 18 19 20 ··· 22 下一页