摘要: 为什么Rowkey这么重要 RowKey 到底是什么 我们常说看一张 HBase 表设计的好不好,就看它的 RowKey 设计的好不好。可见 RowKey 在 HBase 中的地位。那么 RowKey 到底是什么?RowKey 的特点如下: 类似于 MySQL、Oracle中的主键,用于标示唯一的行 阅读全文
posted @ 2019-01-11 17:56 大数据从业者FelixZh 阅读(919) 评论(0) 推荐(0) 编辑
摘要: 在介绍 HBase 是不是列式存储数据库之前,我们先来了解一下什么是行式数据库和列式数据库。 行式数据库和列式数据库 在维基百科里面,对行式数据库和列式数据库的定义为:列式数据库是以列相关存储架构进行数据存储的数据库,主要适合于批量数据处理(OLAP)和即时查询。相对应的是行式数据库,数据以行相关的 阅读全文
posted @ 2019-01-11 17:32 大数据从业者FelixZh 阅读(4601) 评论(2) 推荐(0) 编辑
摘要: 为了能够方便的查看及管理Kafka集群,yahoo提供了一个基于Web的管理工具(Kafka-Manager)。 这个工具可以方便的查看集群中Kafka的Topic的状态(分区、副本及消息量等),支持管理多个集群、重新分配Partition及创建Topic等功能。 jdk、sbt自行安装吧 sbt源 阅读全文
posted @ 2019-01-11 15:20 大数据从业者FelixZh 阅读(1548) 评论(0) 推荐(0) 编辑
摘要: 官方下載地址:https://www.scala-sbt.org/download.html?spm=a2c4e.11153940.blogcont238365.9.42d147e0iF8dhv 解压即安装,配置环境变量。 在conf文件夹下新建repo.properties(默认源真的无法忍受) 阅读全文
posted @ 2019-01-11 14:56 大数据从业者FelixZh 阅读(590) 评论(0) 推荐(0) 编辑