升级到 solr 1.4 的注意事项
原文出处:http://blog.chenlb.com/2009/12/update-to-solr-1-4-matter.html
Solr 1.4 已经正式发布一段时间了,是考虑升级的时候了。记录下我目前环境的情况以及注意事项。
Solr 1.4 比较吸引人的有两功能:一是 Trie 的字段支持高性能的 range query,快10倍;二是 solr replication。
目前扩展的 solr 应用:
1、简单的分词器(solr 中的 TokenizerFactory,非 mmseg4j)。此扩展应用与 solr 1.4 不兼容。
在 solr 1.4 中 TokenizerFactory 接口的方法 TokenStream create(Reader input) 改为 Tokenizer create(Reader input),所以扩展了此接口的分词器都要修改一下。create 的返回声明改为 Tokenizer 就行了。修改后在 solr 1.3 中编译,同时在 solr 1.4 也可以运行的(因为:TokenStream 是 Tokenizer 的父类)。
2、扩展 function 查询的函数,它与 solr 1.4 不兼容。如果 solr 1.3 的扩展在 solr 1.4 中使用会出现空指钟异常:
原因是:ValueSource 中的 getValues(IndexReader reader) 方法是 Deprecated,solr 1.4 中改用 getValues(Map context, IndexReader reader) 方法。所以如果 solr 1.4 中还没有你想要的函数,要修改原来的,以至在 solr 1.4 中能正常使用。
master/slave 升级注意事项:
1、如果在线服务着的应用中升级,先升级 slave 机,schema.xml 中的 field 定义对应好(如果原来是 int 类型的要注意,solr 1.4 把 int 用 tint 类型了。如果要兼容,要把 int 的类型修改成 pint。其它 long,float 一样修改)
2、不修改字段情况(上面情况除外):先升级 slave,安装好,修改好 schema.xml。复制索引(可用旧的方式 shell 复制,solr.home/bin, solr 1.4在 apache-solr-1.4.0\src\scripts 目录)。注意:如果有分布式搜索,要把所有的 shard 都升级好再用,否则分布搜索失败(原因,它们使用了 javabin 输出,不同版本的程序不兼容的)。可正常工作后,再升级 master 的 solr。
我的应该环境,又要修改字段(使用 trie 字段),又是 master/slave 在线的服务。方案大概如下:
1、所有 master/slave 都另起目录安装 solr 1.4。旧的都还在线服务(同时升级中有问题,可以回退)。先安装 master 然后做着索引。
2、安装第一台 slave(先从负载均衡里撤下来),等 master 做好索引后,请求 solr replication 进行复制。然后测试是否正常。最后上线服务。(因为对外面调用的程序不受影响,xml 格式一样,所以可以这样做)
3、重复2,升级其它 slave。
如果带 shard 架构,就要一组 shard 一起升级。
solr replication 的其它问题:一但其它手段(就是指,手动删除一个文档之类的,非 solr replication 机制更新)更新过 slave 的索引,再用 replication 复制索引会多出一份旧的索引,时间长了会占满磁盘的。为了安全,还是写个 shell 定期删除过期的索引。
希望升级愉快。