摘要: Durid的特点 1.为什么会有Durid? 创建Druid的最初意图主要是为了解决查询延迟问题,当时试图使用Hadoop来实现交互式查询分析,但是很难满足实时分析的需要。而Druid提供了以交互方式访问数据的能力,并权衡了查询的灵活性和性能而采取了特殊的存储格式。 2.Durid的优点. 在高并发 阅读全文
posted @ 2020-11-17 18:46 宁君 阅读(393) 评论(0) 推荐(0) 编辑
摘要: 尚硅谷大数据的各种知识 https://zhenchao125.github.io/ https://github.com/zhenchao125 阅读全文
posted @ 2020-11-17 17:38 宁君 阅读(81) 评论(0) 推荐(0) 编辑
摘要: Kylin的特点 0.原理 从Hive读取数据,计算引擎可以用MapReduce 或者Spark, 把结果写入Hbase. 下次查询就会很快,也就是所谓的预计算. 1.为什么会有Kylin? hive查询太慢了 2.Kylin的优点. 写SQL查询,结果预聚合. 有可视化页面 3.什么时候可以用Ky 阅读全文
posted @ 2020-11-17 16:27 宁君 阅读(913) 评论(0) 推荐(0) 编辑
摘要: Kudu的特点 0.原理 列式存储管理器 一个列式存储数据的地方,跟mysql差不多,只是mysql是行式存储. 他是一个集群,能分布式存储. 查询也是写sql语句. 列式存储效率高. 1.为什么会有Kudu? hive读写数据快,分析数据慢 hbase 分析数据快,读写慢. 上面两个是极端,kud 阅读全文
posted @ 2020-11-17 16:24 宁君 阅读(802) 评论(0) 推荐(0) 编辑
摘要: Impala的特点 0. 原理 基于内存的分析框架. 1.为什么会有Impala? hive进行计算太慢了,于是就有了Impala,Impala可以理解为是hive的内存版本. 2.Impala的优点. hive的升级版本,完全基于内存计算 会hive 就会Impala 3.什么时候可以用Impal 阅读全文
posted @ 2020-11-17 16:23 宁君 阅读(282) 评论(0) 推荐(0) 编辑
摘要: 1.为什么会有Clickhouse? 实时数据分析数据库 俄罗斯的谷歌开发的. 2.Clickhouse的优点. 真正的面向列的 DBMS ClickHouse 是一个 DBMS,而不是一个单一的数据库。它允许在运行时创建表和数据库、加载数据和运行 查询,而无需重新配置和重新启动服务器。 数据压缩 阅读全文
posted @ 2020-11-17 16:20 宁君 阅读(3847) 评论(0) 推荐(0) 编辑
摘要: 什么是olap 01、绝大多数请求都是读请求 02、数据以相当大的批次(>1000行)更新,而不是单行更新;或者它根本没有更新 03、数据已添加到数据库,但不会进行修改 04、对于读取,每次查询都从数据库中读取大量的行,但是同时又仅需要少量的列 05、表格“宽”,意味着它们包含大量列 06、查询相对 阅读全文
posted @ 2020-11-17 16:19 宁君 阅读(994) 评论(0) 推荐(0) 编辑