摘要: * HBase框架基础(二) 上一节我们了解了HBase的架构原理和模块组成,这一节我们先来聊一聊HBase的读写数据的过程。 * HBase的读写流程及3个机制 HBase的读数据流程: 1、HRegionServer保存着meta表以及表数据,要访问表数据,首先Client先去访问zookeep 阅读全文
posted @ 2018-01-12 21:12 王振龙 阅读(144) 评论(0) 推荐(0) 编辑
摘要: * 贴士Topic:启动所有集群节点 目的:在一台服务器上执行一个脚本,启动所有集群节点上的相关进程 描述:在学习过程中,你会发现Resourcemanager和HMaster等节点需要登录到节点所在机器启动 所需理论: Shell的区别 ** 登录Shell:粗放来讲,就是你手动使用CRT登录Li 阅读全文
posted @ 2018-01-12 21:10 王振龙 阅读(125) 评论(0) 推荐(0) 编辑
摘要: * Kafka框架基础 官网:kafka.apache.org 框架简介 Apache Kafka是分布式发布-订阅消息系统。它最初由LinkedIn公司开发,之后成为Apache项目的一部分。Kafka是一种快速、可扩展的、设计内在就是分布式的,分区的和可复制的提交日志服务。 相关概念 ** 生产 阅读全文
posted @ 2018-01-12 21:09 王振龙 阅读(217) 评论(0) 推荐(0) 编辑
摘要: * HUE搭配基础 首先简单说一下Hue框架的来源:HUE=HadoopUser Experience,看这名字就知道怎么回事了吧,没错,直白来说就是Hadoop用户体验,是一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给 阅读全文
posted @ 2018-01-12 21:07 王振龙 阅读(308) 评论(0) 推荐(0) 编辑
摘要: * Oozie框架基础 官方文档地址:http://oozie.apache.org/docs/4.0.0/DG_QuickStart.html 除Oozie之外,类似的框架还有: ** Zeus:https://github.com/michael8335/zeus2 ** Azkaban:htt 阅读全文
posted @ 2018-01-12 21:06 王振龙 阅读(278) 评论(0) 推荐(0) 编辑
摘要: Sqoop框架基础 本节我们主要需要了解的是大数据的一些协作框架,也是属于Hadoop生态系统或周边的内容,比如: ** 数据转换工具:Sqoop ** 文件收集库框架:Flume ** 任务调度框架:Oozie ** 大数据Web工具:Hue 这些框架为什么成为主流,请自行百度谷歌,此处不再赘述。 阅读全文
posted @ 2018-01-12 21:04 王振龙 阅读(302) 评论(0) 推荐(0) 编辑
摘要: * Flume框架基础 框架简介: ** Flume提供一个分布式的,可靠的,对大数据量的日志进行高效收集、聚集、移动的服务,Flume只能在Unix环境下运行。 ** Flume基于流式架构,容错性强,也很灵活简单,主要用于在线实时的引用分析。 宏观认知: ** Flume、Kafka用来实时进行 阅读全文
posted @ 2018-01-12 21:01 王振龙 阅读(293) 评论(0) 推荐(0) 编辑
摘要: * Hive框架基础(二) 我们继续讨论hive框架 * Hive的外部表与内部表 内部表:hive默认创建的是内部表 例如: create table table001 (name string , age string) location '/input/table_data'; 此时:会在HD 阅读全文
posted @ 2018-01-12 21:00 王振龙 阅读(282) 评论(0) 推荐(0) 编辑
摘要: * Hive框架基础(一) 一句话:学习Hive有毛用? 那么解释一下 毛用: * 操作接口采用类SQL语法,提供快速开发的能力(不会Java也可以玩运算) * 避免了去写MapReduce,减少开发人员的学习成本(MapReduce运算写断手) * 扩展功能很方便 * 数据库不等同于数据仓库 数据 阅读全文
posted @ 2018-01-12 20:59 王振龙 阅读(169) 评论(0) 推荐(0) 编辑
摘要: ** Hadoop框架基础(五) 已经部署了Hadoop的完全分布式集群,我们知道NameNode节点的正常运行对于整个HDFS系统来说非常重要,如果NameNode宕掉了,那么整个HDFS就要整段垮掉了,所以人类思考,能不能让世界多一点爱:),我们能不能弄个备用的NameNode,一旦正在使用的N 阅读全文
posted @ 2018-01-12 20:57 王振龙 阅读(242) 评论(0) 推荐(0) 编辑
Live2D