开源搜索引擎solr elasticsearch学习计划
其实不单单是研究solr elasticsearch把,进行调研性技术学习时,应该制定一些目标以及里程碑。新的技术调研
学习是一件很爽的事,能学到新技术新东西。但是在学习新技术同时,有几个问题是需要我们思考的。
需不需要制定一个计划,因为漫无目的调研,可能时间过去了,感觉是学到了东西,但可能最终没有学到东西。
或者说没有在指定时间达到我们的目的。这时就需要指定一定的目标,比如最低目的,每个时间段掌握哪些东西。这
样有计划有安排,会对调研工作有一个好的进展,以及进度把握。
再有就是调研产出,一个是用于线上业务或者系统,另外一个值得思考问题,是不是应该产生相应文档,或者文
章,因为当掌握一种技术后,随着时间推移我们会忘记很多东西,所以说记录整理是一个很好的备忘手段,并且记录在
网上有需要帮助朋友,还可以获得相应信息。
书籍,elacticsearch权威指南 https://www.elastic.co/guide/cn/elasticsearch/guide/current/index.html
source
solr源码https://github.com/apache/lucene-solr/#building-lucene-solr
编译按照源码页 readme编译就可以了。
当前日期版本用ant 1.10.2编译存在问题。用ant 1.10.1没有问题。
ik 中文分词器资料 https://github.com/medcl/elasticsearch-analysis-ik/tree/6.x#dictionary-configuration
elasticsearch 6.3.2版本 插件编译
ik 插件配置文件配置文件 IKAnalyzer.cfg.xml
ik支持静态与动态多个词典,动态词库通过http协议判断词库是否变更
ik词库可以下载也可以编译。
下载地址 https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.3.0/elasticsearch-analysis-ik-6.3.0.zip
安装插件方式 ./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.3.0/elasticsearch-analysis-ik-6.3.0.zip
编译通过 git 即可
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict"></entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords"></entry>
<!--用户可以在这里配置远程扩展字典,多个词典用分号分割 -->
<entry key="remote_ext_dict">http://esplug.example.local/static/product.dic;http://esplug.example.local/static/jigouming.dic</entry>
<!--用户可以在这里配置远程扩展停止词字典-->
<!--<entry key="remote_ext_stopwords">words_location</entry>-->
</properties>
插件zip包内资源
elasticsearch 6.2.2版本使用说明 https://blog.gmem.cc/elasticsearch-study-note,这篇比较详细
elasticsearch plugin 开发 https://github.com/elastic/elasticsearch/tree/6.3/plugins
官方 https://www.elastic.co/guide/en/elasticsearch/plugins/current/index.html
lucene原理包含部分数据结构 https://github.com/zzboy/lucene
elasticsearch 性能优化 https://www.cnblogs.com/jajian/p/10465519.html
elasticsearch scroll原理 https://www.jianshu.com/p/91d03b16af77
elasticsearch 原理 https://juejin.im/post/6844904007392051207
待续。。。