2020 年 11月 17 日随笔档案 - 宁君

2020年11月17日

摘要： Durid的特点 1.为什么会有Durid? 创建Druid的最初意图主要是为了解决查询延迟问题，当时试图使用Hadoop来实现交互式查询分析，但是很难满足实时分析的需要。而Druid提供了以交互方式访问数据的能力，并权衡了查询的灵活性和性能而采取了特殊的存储格式。 2.Durid的优点. 在高并发阅读全文

posted @ 2020-11-17 18:46 宁君阅读(412) 评论(0) 推荐(0) 编辑

优秀博客地址

摘要：尚硅谷大数据的各种知识 https://zhenchao125.github.io/ https://github.com/zhenchao125 阅读全文

posted @ 2020-11-17 17:38 宁君阅读(81) 评论(0) 推荐(0) 编辑

Kylin的特点

摘要： Kylin的特点 0.原理从Hive读取数据,计算引擎可以用MapReduce 或者Spark, 把结果写入Hbase. 下次查询就会很快,也就是所谓的预计算. 1.为什么会有Kylin? hive查询太慢了 2.Kylin的优点. 写SQL查询,结果预聚合. 有可视化页面 3.什么时候可以用Ky 阅读全文

posted @ 2020-11-17 16:27 宁君阅读(934) 评论(0) 推荐(0) 编辑

Kudu的特点

摘要： Kudu的特点 0.原理列式存储管理器一个列式存储数据的地方,跟mysql差不多,只是mysql是行式存储. 他是一个集群,能分布式存储. 查询也是写sql语句. 列式存储效率高. 1.为什么会有Kudu? hive读写数据快,分析数据慢 hbase 分析数据快,读写慢. 上面两个是极端,kud 阅读全文

posted @ 2020-11-17 16:24 宁君阅读(827) 评论(0) 推荐(0) 编辑

Impala的特点

摘要： Impala的特点 0. 原理基于内存的分析框架. 1.为什么会有Impala? hive进行计算太慢了,于是就有了Impala,Impala可以理解为是hive的内存版本. 2.Impala的优点. hive的升级版本,完全基于内存计算会hive 就会Impala 3.什么时候可以用Impal 阅读全文

posted @ 2020-11-17 16:23 宁君阅读(288) 评论(0) 推荐(0) 编辑

Clickhouse的特点

摘要： 1.为什么会有Clickhouse? 实时数据分析数据库俄罗斯的谷歌开发的. 2.Clickhouse的优点. 真正的面向列的 DBMS ClickHouse 是一个 DBMS，而不是一个单一的数据库。它允许在运行时创建表和数据库、加载数据和运行查询，而无需重新配置和重新启动服务器。数据压缩阅读全文

posted @ 2020-11-17 16:20 宁君阅读(3876) 评论(0) 推荐(0) 编辑

开源OLAP引擎对比

摘要：什么是olap 01、绝大多数请求都是读请求 02、数据以相当大的批次(>1000行)更新，而不是单行更新;或者它根本没有更新 03、数据已添加到数据库，但不会进行修改 04、对于读取，每次查询都从数据库中读取大量的行，但是同时又仅需要少量的列 05、表格“宽”，意味着它们包含大量列 06、查询相对阅读全文

posted @ 2020-11-17 16:19 宁君阅读(1008) 评论(0) 推荐(0) 编辑

宁君

公告