摘要: 深入分析Parquet列式存储格式 Parquet是面向分析型业务的列式存储格式,由Twitter和Cloudera合作开发,2015年5月从Apache的孵化器里毕业成为Apache顶级项目,最新的版本是1.8.0。 列式存储 列式存储和行式存储相比有哪些优势呢? 1.可以跳过不符合条件的数据,只 阅读全文
posted @ 2018-02-03 19:29 王振龙 阅读(233) 评论(0) 推荐(0) 编辑
摘要: 对无界数据集的连续处理 在我们详细介绍Flink之前,让我们从更高的层面上回顾处理数据时可能遇到的数据集的类型以及您可以选择处理的执行模型的类型。这两个想法经常被混淆,清楚地区分它们是有用的。 首先,两种类型的数据集 无界:连续追加的无限数据集 有界:有限的,不变的数据集 传统上被认为是有限或“批量 阅读全文
posted @ 2018-02-03 15:27 王振龙 阅读(394) 评论(0) 推荐(0) 编辑
摘要: 此文于2015 年 8 月 10 日发布 Tachyon 是什么 Tachyon 是 AMPLab 开发的一款内存分布式文件系统。它介于计算层和存储层之间,可以简单的理解为存储层在内存内的一个 Cache 系统。同 Spark 和 Hadoop 一样,Tachyon 是完全开源的,并且也是一个以 J 阅读全文
posted @ 2018-02-03 15:04 王振龙 阅读(874) 评论(0) 推荐(0) 编辑
摘要: 这羊头很酷... Apache Impala是Apache Hadoop的开源本地分析数据库。Impala由Cloudera,MapR,Oracle和Amazon提供。 在Hadoop上进行BI风格的查询 Impala为Hadoop上的BI /分析查询提供了低延迟和高并发性(不是由Apache Hi 阅读全文
posted @ 2018-02-03 14:37 王振龙 阅读(323) 评论(0) 推荐(0) 编辑
摘要: Apache Kylin™是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc. 开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。 KYLIN是什么? - 可扩展超快OLAP引擎: Kylin是为减少 阅读全文
posted @ 2018-02-03 14:17 王振龙 阅读(285) 评论(0) 推荐(0) 编辑
摘要: 涉及概念梳理:命名空间 4.1.1、命名空间的结构 1) Table:表,所有的表都是命名空间的成员,即表必属于某个命名空间,如果没有指定,则在default默认的命名空间中。 2) RegionServer group:一个命名空间包含了默认的RegionServer Group。 3) Perm 阅读全文
posted @ 2018-02-03 11:16 王振龙 阅读(1274) 评论(0) 推荐(0) 编辑
摘要: 高可用 在HBase中Hmaster负责监控RegionServer的生命周期,均衡RegionServer的负载,如果Hmaster挂掉了,那么整个HBase集群将陷入不健康的状态,并且此时的工作状态并不会维持太久。所以HBase支持对Hmaster的高可用配置。 1) 关闭HBase集群(如果没 阅读全文
posted @ 2018-02-03 11:02 王振龙 阅读(344) 评论(0) 推荐(0) 编辑
摘要: HBase读数据流程 1) HRegionServer保存着meta表以及表数据,要访问表数据,首先Client先去访问zookeeper,从zookeeper里面获取meta表所在的位置信息,即找到这个meta表在哪个HRegionServer上保存着。 2) 接着Client通过刚才获取到的HR 阅读全文
posted @ 2018-02-03 10:19 王振龙 阅读(209) 评论(0) 推荐(0) 编辑
摘要: 问题描述如下: 出现此问题可能是zookeeper不稳定造成的,采用的是虚拟机,经常挂起的状态,使用hbase的list命令出现下面错误,这个可能是hbase的稳定性造成的.可能还有其他方法.我的集群是这种情况. 注意:本博文目的是为了记录和复习,不建议作为教程. 感谢http://www.cnbl 阅读全文
posted @ 2018-02-03 10:07 王振龙 阅读(348) 评论(0) 推荐(0) 编辑
摘要: 1.1. 命令 名称 命令表达式 创建表 create '表名', '列族名1','列族名2','列族名N' 查看所有表 list 描述表 describe ‘表名’ 判断表存在 exists '表名' 判断是否禁用启用表 is_enabled '表名' is_disabled ‘表名’ 添加记录 阅读全文
posted @ 2018-02-03 09:43 王振龙 阅读(126) 评论(0) 推荐(0) 编辑
Live2D