2018年5月31日

大牛博客!Spark / Hadoop / Kafka / HBase / Storm

摘要: 在这里,非常感谢下面的著名大牛们,一路的帮助和学习,给予了我很大的动力! 有了Hadoop,再次有了Spark,一次又一次,一晚又一晚的努力相伴! HBase简介(很好的梳理资料) 1、 博客主页:http://jiajun.iteye.com/ 2、博客主页:http://www.cnblogs. 阅读全文

posted @ 2018-05-31 11:23 Hi,王松柏 阅读(1415) 评论(0) 推荐(0) 编辑

Storm、Flume、Hive、HBase和Pig等学习笔记

摘要: 本博文主要的内容有 .Storm .Flume .Scribe .二次排序详解 .InputFormat的实际使用 .MapReduce迭代器的不同 .HBase编码格式的细节 .设置SingleColumnValueFilter时候注意的地方 .HBase中有两张特殊的Table,ROOT-和.M 阅读全文

posted @ 2018-05-31 11:21 Hi,王松柏 阅读(172) 评论(0) 推荐(0) 编辑

HBase学习笔记

摘要: 本博文的主要内容有 .HBase .特点 .HBase在Hadoop子系统中的位置 .HBase表结构 .row key ,即 rc .Column Family,即 cf .时间戳 .Table & Region .RegionServer概念 .HBase模型 .Client .Zookeepe 阅读全文

posted @ 2018-05-31 11:20 Hi,王松柏 阅读(208) 评论(0) 推荐(0) 编辑

HBase HA的分布式集群部署(适合3、5节点)

摘要: 本博文的主要内容有: .HBase的分布模式(3、5节点)安装 .HBase的分布模式(3、5节点)的启动 .HBase HA的分布式集群的安装 .HBase HA的分布式集群的启动 .HBase HA的切换 HBase HA分布式集群搭建———集群架构 HBase HA分布式集群搭建———安装步骤 阅读全文

posted @ 2018-05-31 11:18 Hi,王松柏 阅读(1421) 评论(0) 推荐(0) 编辑

hbase-shell + hbase的java api

摘要: 本博文的主要内容有 .HBase的单机模式(1节点)安装 .HBase的单机模式(1节点)的启动 .HBase的伪分布模式(1节点)安装 .HBase的伪分布模式(1节点)的启动 .HBase的分布模式(3、5节点)安装 .HBase的分布模式(3、5节点)的启动 见博客: HBase HA的分布式 阅读全文

posted @ 2018-05-31 11:17 Hi,王松柏 阅读(700) 评论(0) 推荐(0) 编辑

Hadoop Hive概念学习系列之什么是Hive?

摘要: 参考 《Hadoop大数据分析与挖掘实战》的在线电子书阅读 http://yuedu.baidu.com/ebook/d128cf8e33687e21ae45a935?pn=1&click_type=10010002 Hive最初是应Facebook每天产生的海量新兴社会网络数据进行管理和机器学习的 阅读全文

posted @ 2018-05-31 11:16 Hi,王松柏 阅读(7857) 评论(0) 推荐(0) 编辑

hql语法及自定义函数(含array、map讲解) + hive的java api

摘要: 本博文的主要内容如下: .hive的详细官方手册 .hive支持的数据类型 .Hive Shell .Hive工程所需依赖的jar包 .hive自定义函数 .分桶4 .附PPT hive的详细官方手册 http://hive.apache.org/ https://cwiki.apache.org/ 阅读全文

posted @ 2018-05-31 11:15 Hi,王松柏 阅读(8236) 评论(0) 推荐(0) 编辑

hbase表结构 + hbase集群架构及表存储机制

摘要: 本博文的主要内容有 .hbase读取数据过程 .HBase表结构 .附带PPT http://hbase.apache.org/ 读写的时候,就需要用hbase了,换句话说,就是读写的时候。需要数据库。 在哪些领域,需要数据库? 只要做大量的数据存储,就需要用到数据库。 数据库比文件系统,提供了更好 阅读全文

posted @ 2018-05-31 11:14 Hi,王松柏 阅读(241) 评论(0) 推荐(0) 编辑

hive常见问题解决干货大全

摘要: 问题一: FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. java.lang.RuntimeException: Unable to instantiate org.apache. 阅读全文

posted @ 2018-05-31 11:12 Hi,王松柏 阅读(429) 评论(0) 推荐(0) 编辑

hive的使用 + hive的常用语法

摘要: 本博文的主要内容有: .hive的常用语法 .内部表 .外部表 .内部表,被drop掉,会发生什么? .外部表,被drop掉,会发生什么? .内部表和外部表的,保存的路径在哪? .用于创建一些临时表存储中间结果 .用于向临时表中追加中间结果数据 .分区表(分为,分区内部表和分区外部表) .hive的 阅读全文

posted @ 2018-05-31 11:12 Hi,王松柏 阅读(4464) 评论(0) 推荐(0) 编辑

导航