摘要: 一、 Window 下安装 下载地址:https://github.com/MSOpenTech/redis/releases。 Redis 支持 32 位和 64 位。这个需要根据你系统平台的实际情况选择,这里我们下载 Redis-x64-xxx.zip压缩包到 C 盘,解压后,将文件夹重新命名为 阅读全文
posted @ 2019-06-05 14:25 蚂蚁的天空 阅读(175) 评论(0) 推荐(0) 编辑
摘要: BM25相关度打分公式 BM25算法是一种常见用来做相关度打分的公式,思路比较简单,主要就是计算一个query里面所有词和文档的相关度,然后在把分数做累加操作,而每个词的相关度分数主要还是受到tf/idf的影响。公式如下: R(qi,d)是每个词和文档的相关度值,其中qi代表每个词,d代表相关的文档 阅读全文
posted @ 2019-03-26 16:13 蚂蚁的天空 阅读(3105) 评论(0) 推荐(1) 编辑
摘要: 、Elasticsearch sqles的查询虽然功能很强大,但是查询语言(DSL)很麻烦,不管是封装json还是通过python/java的api进行封装,都不方便。而elasticsearch-SQL可以用sql查询es,对于不熟悉es的DSL的人来说,更为简便和易读。Elasticsearch 阅读全文
posted @ 2019-03-25 16:29 蚂蚁的天空 阅读(525) 评论(0) 推荐(0) 编辑
摘要: 第一种方法: 1.HanLP分词器插件下载地址https://github.com/pengcong90/elasticsearch-analysis-hanlp/releases下载analysis-hanlp.zip 2.解压到ElasticSearch下plugins目录下 3.配置修改ana 阅读全文
posted @ 2019-03-12 09:07 蚂蚁的天空 阅读(6356) 评论(0) 推荐(1) 编辑
摘要: 同义词:又叫近似词,近义词,联想词等等在这里我统一叫同义词。 近义词组件已经是elasticsearch自带的了,所以不需要额外安装插件,但是想要让近义词和IK一起使用,就需要配置自己的分析器了。 首先创建近义词文档 在elasticsearch的config目录下创建analysis文件夹创建自己 阅读全文
posted @ 2019-02-22 09:30 蚂蚁的天空 阅读(2179) 评论(0) 推荐(0) 编辑
摘要: 进当我们一个java文件依赖很多jar包时,我们把java文件打成jar文件,需要配置响应的依赖jar,这个很麻烦,所以使用Fat jar。 这个插件在eclipse下安装可能会出现各种错误,出现错误的原因:(出现错误的原因是Eclipse的更新管理P2出错了。p2有它的一个垃圾回收机制,之前删除的 阅读全文
posted @ 2018-12-07 17:06 蚂蚁的天空 阅读(896) 评论(0) 推荐(0) 编辑
摘要: 一, 下载ssh 下载地址:https://sourceforge.net/projects/sshwindows/files/OldFiles/ 当文件下载完成后点击运行。 点击 Next. 如果你不希望在你的桌面运行ssh 服务,去掉server前面的勾。然后单击next 一直到安装完成,运行s 阅读全文
posted @ 2018-11-27 17:38 蚂蚁的天空 阅读(727) 评论(0) 推荐(0) 编辑
摘要: 1. 安装 在Eclipse help -> Eclipse Marketplace下搜索Memory: 按照操作流程安装完成,重启Eclipse. 2,编写测试代码: 3.Eclipse中的运行参数设置 -Dfile.encoding=UTF-8 -Xms20m -Xmx20m ##设置堆大小20 阅读全文
posted @ 2018-11-22 10:01 蚂蚁的天空 阅读(3055) 评论(0) 推荐(0) 编辑
摘要: 一,原料准备 1,下载hadoop 地址:hadoophttps://hadoop.apache.org/releases.html 2,下载JDK 地址:https://www.oracle.com/technetwork/java/javase/downloads/index.html 3, 下 阅读全文
posted @ 2018-11-21 15:10 蚂蚁的天空 阅读(369) 评论(0) 推荐(0) 编辑
摘要: cluster.name: es-cluster # 集群中的名称node.name: node_01 # 该节点名称node.master: true # 意思是该节点为主节点node.data: false # 表示这不是数据节点network.host: 192.168.1.119 # 监听全 阅读全文
posted @ 2018-05-07 15:26 蚂蚁的天空 阅读(763) 评论(0) 推荐(0) 编辑