随笔分类 -  大数据

摘要:[toc] # 前言 Elasticsearch太强大了,强大到跟python一样,一种查询能好几种语法。其实我们用到的可能只是其中的一部分,比如:全文搜索。 我们一般是会将mysql的部分字段导入到es,再查询出相应的ID,再根据这些ID去数据库找出来。 问题来了:数据导入到es后,很多人都要面对 阅读全文
posted @ 2021-08-17 17:47 雪山飞猪 阅读(3353) 评论(2) 推荐(3) 编辑
摘要:[toc] # 一、Kibana是什么 Kibana 是为 Elasticsearch设计的开源分析和可视化平台。你可以使用 Kibana 来搜索,查看存储在 Elasticsearch 索引中的数据并与之交互。你可以很容易实现高级的数据分析和可视化,以图表的形式展现出来。 使用前我们肯定需要先有E 阅读全文
posted @ 2020-03-16 13:25 雪山飞猪 阅读(244354) 评论(17) 推荐(24) 编辑
摘要:[toc] Lucene是目前最为流行的开源全文搜索引擎工具包,提供了完整的查询引擎和索引引擎,部分文本分析引擎。 我们平时使用kibana、阿里云的日志查询或者其他一些lucene二次开发的产品,几乎都支持lucene语法。 下面给大家演示各种查询方式,更多请参考 [Apache Lucene - 阅读全文
posted @ 2020-03-16 06:57 雪山飞猪 阅读(23360) 评论(0) 推荐(7) 编辑
摘要:[toc] # 前言 Elasticsearch 是一个分布式、可扩展、实时的搜索与数据分析引擎,通过它我们可以构建出一个强大的全文搜索系统,解决诸如文章检索慢,商品检索慢、MySQL的like查询慢这样的问题。 Elasticsearch是基于hadoop创始人道哥的另一杰作Lucene实现的,速 阅读全文
posted @ 2020-03-15 15:00 雪山飞猪 阅读(9899) 评论(1) 推荐(2) 编辑
摘要:[toc] 前言 数据的搜索与查找是计算机软件的核心算法,对海量文档进行快速检索,主要使用的就是倒排索引技术。 可能有人会说,我们平时在MySQL已经可以直接使用like查询了,为啥还要认识叫倒排索引的东西? 我们用下面例子说明,假设有一本书,相应页码存储的文章内容如下 页码 | 内容 | | 1| 阅读全文
posted @ 2020-03-11 22:54 雪山飞猪 阅读(3741) 评论(0) 推荐(4) 编辑
摘要:一、大数据的发展史 2004年 Google前后发表三篇论文,也就是传说中的“三驾马车” 分布式式文件系统GFS 大数据分布式计算框架MapReduce NoSQL数据库系统BigTable 2006年 Doug Cutting启动了一个赫赫有名的项目Hadoop,主要包括Hadoop分布式文件系统 阅读全文
posted @ 2019-08-19 10:48 雪山飞猪 阅读(4898) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示