2017年6月22日

HBase中的备份和故障恢复方法

摘要: 在这篇文章中,你将会对在HBase中可用的数据备份机制有一个高层次的简要了解,并且知道多种数据恢复/容灾机制。在阅读了这篇文章之后,你应该能对你的业务需要那种BDR策略有了自己的判断。你也应该明白各种机制各自的优缺点(适用于CDH 4.3.0/HBase 0.94.6及更高版本)。备份HBase是一个基于LSM树(log-structured merge-tree)的分布式数据存储系统,它使用复杂... 阅读全文

posted @ 2017-06-22 11:29 Charlist00 阅读(1074) 评论(0) 推荐(0) 编辑

Hbase写数据,存数据,读数据的详细过程

摘要: Client写入 -> 存入MemStore,一直到MemStore满 -> Flush成一个StoreFile,直至增长到一定阈值 -> 出发Compact合并操作 -> 多个StoreFile合并成一个StoreFile,同时进行版本合并和数据删除 -> 当StoreFiles Compact后,逐步形成越来越大的StoreFile -> 单个StoreFile大小超过一定阈值后,触发Spli... 阅读全文

posted @ 2017-06-22 11:29 Charlist00 阅读(656) 评论(0) 推荐(0) 编辑

HBase 常用Shell命令

摘要: 两个月前使用过hbase,现在最基本的命令都淡忘了,留一个备查~进入hbase shell console$HBASE_HOME/bin/hbase shell如果有kerberos认证,需要事先使用相应的keytab进行一下认证(使用kinit命令),认证成功之后再使用hbase shell进入可以使用whoami命令可查看当前用户hbase(main)> whoami表的管理1)查看有哪些表h... 阅读全文

posted @ 2017-06-22 11:28 Charlist00 阅读(164) 评论(0) 推荐(0) 编辑

HDFS的快照原理和Hbase基于快照的表修复

摘要: 前一篇文章《HDFS和Hbase误删数据恢复》主要讲了hdfs的回收站机制和Hbase的删除策略。根据hbase的删除策略进行hbase的数据表恢复。本文主要介绍了hdfs的快照原理和根据快照进行的数据恢复。1.Hdfs的快照原理1.1 快照原理 Hdfs的快照(snapshot)是在某一时间点对指定文件系统拷贝,快照采用只读模式,可以对重要数据进行恢复、防止用户错误性的操作。 ... 阅读全文

posted @ 2017-06-22 11:28 Charlist00 阅读(1494) 评论(0) 推荐(0) 编辑

HBase shell

摘要: HBase 为用户提供了一个非常方便的使用方式, 我们称之为“HBase Shell”。HBase Shell 提供了大多数的 HBase 命令, 通过 HBase Shell 用户可以方便地创建、删除及修改表, 还可以向表中添加数据、列出表中的相关信息等。备注:写错 HBase Shell 命令时用键盘上的“Delete”进行删除,“Backspace”不起作用。在启动 HBase 之后,用户可... 阅读全文

posted @ 2017-06-22 11:28 Charlist00 阅读(203) 评论(0) 推荐(0) 编辑

master.TableNamespaceManager: Namespace table not found. Creating...

摘要: 1、错误描述: 出现上述这个错误的原因是我之前已经安装了Cloudera Manager中的CDH,其中添加了所有的服务,当然也包含HBase。然后重新安装的时候,就会出现如下错误: Failed to become active master,org.apache.hadoop.hbase.TableExistsException:hbase:namespace.根据上面错误的我们可以很清楚... 阅读全文

posted @ 2017-06-22 11:27 Charlist00 阅读(310) 评论(0) 推荐(0) 编辑

Hbase 统计表行数的3种方式总结

摘要: 有些时候需要我们去统计某一个Hbase表的行数,由于hbase本身不支持SQL语言,只能通过其他方式实现。可以通过一下几种方式实现hbase表的行数统计工作:1.count命令最直接的方式是在hbase shell中执行count的命令可以统计行数。[html] view plain copyhbase> count ‘t1′ hbase> count ‘t1′, INTERVAL => 100... 阅读全文

posted @ 2017-06-22 11:26 Charlist00 阅读(3809) 评论(0) 推荐(0) 编辑

HDFS的快照原理和Hbase基于快照的表修复

摘要: 前一篇文章《HDFS和Hbase误删数据恢复》主要讲了hdfs的回收站机制和Hbase的删除策略。根据hbase的删除策略进行hbase的数据表恢复。本文主要介绍了hdfs的快照原理和根据快照进行的数据恢复。1.Hdfs的快照原理1.1 快照原理 Hdfs的快照(snapshot)是在某一时间点对指定文件系统拷贝,快照采用只读模式,可以对重要数据进行恢复、防止用户错误性的操作。 ... 阅读全文

posted @ 2017-06-22 11:26 Charlist00 阅读(238) 评论(0) 推荐(0) 编辑

HBase WAL原理学习

摘要: 1.概述 客户端往RegionServer端提交数据的时候,会写WAL日志,只有当WAL日志写成功以后,客户端才会被告诉提交数据成功,如果写WAL失败会告知客户端提交失败,换句话说这其实是一个数据落地的过程。在一个RegionServer上的所有的Region都共享一个HLog,一次数据的提交是先写WAL,再写memstore,示意图如下 2.HLog Class WAL的实现类是HLog,当一... 阅读全文

posted @ 2017-06-22 11:26 Charlist00 阅读(1727) 评论(0) 推荐(0) 编辑

HBase TableExistsException: hbase:namespace

摘要: 这个报错一般存在于独立安装Zookeeper集群中。报这个错的操作时这样的,先停掉了了HbaseformatZK后重启Hbase启动hbase shell 后HMaster挂掉,看log里就有这个报错TableExistsException: hbase:namespace这个时候需要输入zkCli.sh,把Zookeeper里的/hbase目录删除。 这个报错的意思有可能是指hbase的name... 阅读全文

posted @ 2017-06-22 11:26 Charlist00 阅读(140) 评论(0) 推荐(0) 编辑

HBase常用操作之namespace

摘要: 1、介绍在HBase中,namespace命名空间指对一组表的逻辑分组,类似RDBMS中的database,方便对表在业务上划分。Apache HBase从0.98.0, 0.95.2两个版本开始支持namespace级别的授权操作,HBase全局管理员可以创建、修改和回收namespace的授权。2、namespaceHBase系统默认定义了两个缺省的namespacehbase:系统内建表,包... 阅读全文

posted @ 2017-06-22 11:26 Charlist00 阅读(713) 评论(0) 推荐(0) 编辑

Hbase原理、基本概念、基本架构

摘要: 概述HBase是一个构建在HDFS上的分布式列存储系统;HBase是基于Google BigTable模型开发的,典型的key/value系统;HBase是Apache Hadoop生态系统中的重要一员,主要用于海量结构化数据存储;从逻辑上讲,HBase将数据按照表、行和列进行存储。与hadoop一样,Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力。Hbase表... 阅读全文

posted @ 2017-06-22 11:25 Charlist00 阅读(425) 评论(0) 推荐(0) 编辑

hbase 修复 hbase hbck

摘要: hbase hbck新版本的 hbck 可以修复各种错误,修复选项是: (1)-fix,向下兼容用,被-fixAssignments替代 (2)-fixAssignments,用于修复region assignments错误 (3)-fixMeta,用于修复meta表的问题,前提是HDFS上面的region info信息有并且正确。 (4)-fixHdfsHoles,修复r... 阅读全文

posted @ 2017-06-22 11:25 Charlist00 阅读(2241) 评论(0) 推荐(0) 编辑

hbase数据备份或者容灾方案

摘要: HBase的数据备份或者容灾方案有这几种:Distcp,CopyTable,Export/Import,Snapshot,Replication,以下分别介绍(以下描述的内容均是基于0.94.20版本)。 一、Distcp 在使用distcp命令copy hdfs文件的方式实现备份时,需要禁用备份表确保copy时该表没有数据写入,对于在线服务的hbase集群,该方式不可用,而且在一些文章中可以... 阅读全文

posted @ 2017-06-22 11:25 Charlist00 阅读(2546) 评论(1) 推荐(0) 编辑

Hbase 日常运维

摘要: 日常维护的命令 1,major_compact 'testtable',通常生产环境会关闭自动major_compact(配置文件中hbase.hregion.majorcompaction设 为0),选择一个晚上用户少的时间窗口手工major_compact,如果hbase更新不是太频繁,可以一个星期对所有表做一次 major_compact,这个可以在做完一次major_compact后... 阅读全文

posted @ 2017-06-22 11:25 Charlist00 阅读(2462) 评论(0) 推荐(2) 编辑

HBase shell scan 模糊查询

摘要: 0.进入hbase shell./hbase shell help help “get” #查看单独的某个命令的帮助1. 一般命令status 查看状态version 查看版本2.DDL(数据定义语言Data Definition Language)命令1. 创建表create ‘表名称’,’列名称1’,’列名称2’,’列名称3’ 如:create 'member','member_id','ad... 阅读全文

posted @ 2017-06-22 11:24 Charlist00 阅读(3767) 评论(0) 推荐(0) 编辑

HBase 超详细介绍

摘要: 1-HBase的安装HBase是什么?HBase是Apache Hadoop中的一个子项目,Hbase依托于Hadoop的HDFS作为最基本存储基础单元,通过使用hadoop的DFS工具就可以看到这些这些数据 存储文件夹的结构,还可以通过Map/Reduce的框架(算法)对HBase进行操作,如右侧的图所示:HBase在产品中还包含了Jetty,在HBase启动时采用嵌入式的方式来启动Jetty,... 阅读全文

posted @ 2017-06-22 11:24 Charlist00 阅读(18250) 评论(0) 推荐(0) 编辑

HBase读延迟的12种优化套

摘要: 任何系统都会有各种各样的问题,有些是系统本身设计问题,有些却是使用姿势问题。HBase也一样,在真实生产线上大家或多或少都会遇到很多问题,有些是HBase还需要完善的,有些是我们确实对它了解太少。 总结起来,大家遇到的主要问题无非是Full GC异常导致宕机问题、RIT问题、写吞吐量太低以及读延迟较大。 Full GC问题的解决方案目前主要有两方面需要注意,一方面需要查看GC日志确认是哪种Ful... 阅读全文

posted @ 2017-06-22 11:24 Charlist00 阅读(1289) 评论(0) 推荐(0) 编辑

HBase 官方文档0.90.4

摘要: HBase 官方文档0.90.4Copyright © 2010 Apache Software Foundation, 盛大游戏-数据仓库团队-颜开(译)Revision HistoryRevision 0.90.4配置,数据模型使用入门Abstract这是 Apache HBase的官方文档, Hbase是一个分布式,版本化(versioned),构建在 Apache Hadoop和 Apac... 阅读全文

posted @ 2017-06-22 11:23 Charlist00 阅读(340) 评论(0) 推荐(0) 编辑

HDFS原理及操作

摘要: 1 环境说明部署节点操作系统为CentOS,防火墙和SElinux禁用,创建了一个shiyanlou用户并在系统根目录下创建/app目录,用于存放 Hadoop等组件运行包。因为该目录用于安装hadoop等组件程序,用户对shiyanlou必须赋予rwx权限(一般做法是root用户在根目录下 创建/app目录,并修改该目录拥有者为shiyanlou(chown –R shiyanlou:sh... 阅读全文

posted @ 2017-06-22 11:21 Charlist00 阅读(583) 评论(0) 推荐(0) 编辑

导航