摘要: 上课我们介绍了倒排索引,在里面提到了分词的概念,分词器就是用来分词的。 分词器是ES中专门处理分词的组件,英文为Analyzer,定义为:从一串文本中切分出一个一个的词条,并对每个词条进行标准化。它由三部分组成, Character Filters:分词之前进行预处理,比如去除html标签 Toke 阅读全文
posted @ 2018-11-12 19:04 卡卡他大哥 阅读(4634) 评论(0) 推荐(1) 编辑
摘要: 大家知道,ES的发明者初衷是想做一个搜索引擎给自己老婆用来搜菜谱,所以ES的核心工作就是做搜索,下面我们就开始讲关于搜索方面的知识点。 DOC的概念我们第一课就讲过,它是ES存储数据的最小单元,我们再延伸一下: 倒排索引基本概念: 文档(Document):一般搜索引擎的处理对象是互联网网页,而文档 阅读全文
posted @ 2018-11-12 18:18 卡卡他大哥 阅读(1662) 评论(0) 推荐(2) 编辑
摘要: 语法规则: location [=|~|~*|^~] /uri/ { … } = 开头表示精确匹配 ^~ 开头表示uri以某个常规字符串开头,理解为匹配 url路径即可。nginx不对url做编码,因此请求为/static/20%/aa,可以被规则^~ /static/ /aa匹配到(注意是空格)。 阅读全文
posted @ 2018-11-12 17:29 卡卡他大哥 阅读(861) 评论(0) 推荐(0) 编辑