如何用elasticsearch构架亿级数据采集系统(第1集:elasticsearch概述)
elasticsearch 是一个全文搜索引擎,近年来随着 ELK(基于elasticsearch 的日志分析系统)的流行,逐渐被大家所认可。elasticsearch 是一个基于Lucene 的搜索服务器。Lucene 是一个很出名的底层的搜索接口,但是Lucene的使用难度很高,elasticsearch对Lucene进行了一次封装,使得它对我们开发者更友好。
(一)为什么需要 elasticsearch
- 希望搜索解决方案要高效;
- 希望零配置和完全免费的搜索方案;
- 希望能够简单的通过 json 和 http 与搜索引擎交互;
- 希望我们的搜索服务器稳定;
- 希望能够简单的将一台服务器扩展到上百台;
(二)当前使用 elasticsearch 的企业
大公司都在使用它作为搜索引擎服务
- DELL
- CISCO;
- 微软;
- GitHub;
(三)什么是搜索引擎
很多初学者认为,搜索可以通过像数据库那样的 like 语句做查询,那问什么还会独立出一个搜索引擎呢?
关系数据搜索的缺点
关系型数据库使用 like语句和正则表达式匹配有什么缺点;
- 无法打分;
- 无分布式;
- 无法解析搜索请求;
- 关系数据库需要自己来完成分词;
- 效率低;
- 分词;