摘要:
Phoenix HBase适合存储大量的对关系运算要求低的NOSQL数据,受HBase 设计上的限制不能直接使用原生的API执行在关系数据库中普遍使用的条件判断和聚合等操作。HBase很优秀,一些团队寻求在HBase之上提供一种更面向普通开发人员的操作方式,Apache Phoenix即是。 Pho 阅读全文
摘要:
MapReduce on HBase 流程图☆ 不能直接穿到底层去读取 HFile ,因为有一部分数据在 MemStore 中,所以要去和 RegionServer 建立连接,获取数据 一个 region 会生成一个切片,即对应一个 Map 任务,本质上是通过 Scan 获取数据 TableInpu 阅读全文
摘要:
HBase过滤器 添加依赖 <dependencies> <dependency> <groupId>org.apache.hbase</groupId> <artifactId>hbase-client</artifactId> <version>1.4.6</version> </depende 阅读全文
摘要:
单独 启动 或 停止 HMaster、HRegionServer 的进程 hbase-daemon.sh start/stop master/regionserver H -- 可以省略 HBase 架构图 Plus 及读写流程 BLockCache BlockCache基于客户端对数据的访问频率, 阅读全文
摘要:
HBase Java API 添加依赖 <dependencies> <dependency> <groupId>org.apache.hbase</groupId> <artifactId>hbase-client</artifactId> <version>1.4.6</version> </d 阅读全文
摘要:
几个主要 Hbase API 类和数据模型之间的对应关系: HBaseAdmin 类:org.apache.hadoop.hbase.client.HBaseAdmin 作用:提供了一个接口来管理 HBase 数据库的表信息。它提供的方法包括:创建表,删 除表,列出表项,使表有效或无效,以及添加或删 阅读全文
摘要:
HBase数据模型 HRegion是HBase中分布式存储和负载均衡的最小单元。最小单元就表示不同的HRegion可以分布在不同的 HRegionServer上。 在 HDFS 上 HBase 每个表的目录下,会以 Region 划分并形成对应的目录 HRegion由一个或者多个Store组成,每个 阅读全文
摘要:
Hbase系统架构 HMaster -- 主节点 作用: 为HRegionRerver分配region 负责HRegionRerver的负载均衡 发现失效的HRegionRerver并重新分配其上的region 管理用户对table的结构增删改操作,这里少了查 HRegionServer -- 从节 阅读全文
摘要:
Hadoop和HBase HBase是基于Hadoop集群之上来搭建的 Hadoop有一些局限性的: 做一些批量的数据处理,吞吐量比较高,但是它对随机查询、实时操作性能是不行的 HBase是NoSQL数据库的一种,它跟传统的RDBMS(关系数据库管理系统)有很大的差别 不支持JOIN的,摒弃了关系型 阅读全文
摘要:
操作HBase的方式 HBase 自带的 shell Hive 中使用外部表 MapReduce Phoenix Java API -- 最常用 HBase shell 的常用基本操作 // 进入 hbase shell // 退出 exit 在 HBase shell 中一行命令的结束不需要以 ; 阅读全文