随笔分类 - weekend110（Hadoop、MapReduce、Zookeeper、Hive、HBase、flume、sqoop、kafka）

day1 Hadoop原理介绍和搭建分布式环境 day2 HDFS体系结构及shell、java操作方式 day3 MapReduce体系结构及各种算法（1） day4 MapReduce体系结构及各种算法（2） day5 Zookeeper操作、Hadoop集群搭建、sqoop day6 HBase体系结构及基本操作、flume、pig day7 Hive体系结构及基本操作和最后项目

5 kafka整合storm

摘要：本博文的主要内容有 .kafka整合storm .storm-kafka工程 .storm + kafka的具体应用场景有哪些？要想kafka整合storm，则必须要把这个storm-kafka-0.9.2-incubating.jar，放到工程里去。无非，就是storm要去拿kafka里的东西阅读全文

posted @ 2016-10-16 10:45 大数据和AI躺过的坑阅读(2022) 评论(0) 推荐(0) 编辑

4 kafka集群部署及kafka生产者java客户端编程 + kafka消费者java客户端编程

摘要：本博文的主要内容有 kafka的单机模式部署 kafka的分布式模式部署生产者java客户端编程消费者java客户端编程运行kafka ，需要依赖 zookeeper，你可以使用已有的 zookeeper 集群或者利用 kafka自带的zookeeper。单机模式，用的是kafka自带的zo 阅读全文

posted @ 2016-10-16 10:00 大数据和AI躺过的坑阅读(20112) 评论(0) 推荐(1) 编辑

3 kafka介绍

摘要：本博文的主要内容有 .kafka的官网介绍 http://kafka.apache.org/ 来，用官网上的教程，快速入门。 http://kafka.apache.org/documentation kafka的官网文档教程。 The Producer API allows an applicat 阅读全文

posted @ 2016-10-16 09:23 大数据和AI躺过的坑阅读(2281) 评论(0) 推荐(0) 编辑

2 storm的topology提交执行

摘要：本博文的主要内容有 .storm单机模式，打包，放到storm集群 .Storm的并发机制图 .Storm的相关概念 .附PPT 打包，放到storm集群去。我这里，是单机模式下的storm。 weekend110-storm -> Export -> JAR file -> 当然，这边，肯定是，准阅读全文

posted @ 2016-10-16 09:01 大数据和AI躺过的坑阅读(4899) 评论(1) 推荐(1) 编辑

1 storm基本概念 + storm编程规范及demo编写

摘要：本博文的主要内容有 .Storm的单机模式安装 .Storm的分布式安装（3节点） .No space left on device .storm工程的eclipse的java编写 http://storm.apache.org/ 分布式的一个计算系统，但是跟mr不一样，就是实时的，实时的跟Mr离线阅读全文

posted @ 2016-10-15 22:52 大数据和AI躺过的坑阅读(7243) 评论(0) 推荐(2) 编辑

weekend110（Hadoop）的第七天笔记

摘要：（2015年1月31日）课程目录 01-storm基本概念 02-storm编程规范及demo编写 03-storm的topology提交执行 04-kafka介绍 05-kafka集群部署及客户端编程 06-kafka消费者java客户端编程 07-kafka整合storm 阅读全文

posted @ 2016-10-13 16:46 大数据和AI躺过的坑阅读(251) 评论(0) 推荐(0) 编辑

5 hbase-shell + hbase的java api

摘要：本博文的主要内容有 .HBase的单机模式（1节点）安装 .HBase的单机模式（1节点）的启动 .HBase的伪分布模式（1节点）安装 .HBase的伪分布模式（1节点）的启动 .HBase的分布模式（3、5节点）安装 .HBase的分布模式（3、5节点）的启动见博客： HBase HA的分布式阅读全文

posted @ 2016-10-11 22:53 大数据和AI躺过的坑阅读(3583) 评论(1) 推荐(0) 编辑

Hadoop Hive概念学习系列之什么是Hive？（一）

摘要：参考《Hadoop大数据分析与挖掘实战》的在线电子书阅读 http://yuedu.baidu.com/ebook/d128cf8e33687e21ae45a935?pn=1&click_type=10010002 Hive最初是应Facebook每天产生的海量新兴社会网络数据进行管理和机器学习的阅读全文

posted @ 2016-10-11 22:25 大数据和AI躺过的坑阅读(1112) 评论(0) 推荐(0) 编辑

4 hbase表结构 + hbase集群架构及表存储机制

摘要：本博文的主要内容有 .hbase读取数据过程 .HBase表结构 .附带PPT http://hbase.apache.org/ 读写的时候，就需要用hbase了，换句话说，就是读写的时候。需要数据库。在哪些领域，需要数据库？只要做大量的数据存储，就需要用到数据库。数据库比文件系统，提供了更好阅读全文

posted @ 2016-10-11 16:46 大数据和AI躺过的坑阅读(1092) 评论(0) 推荐(0) 编辑

3 hql语法及自定义函数（含array、map讲解） + hive的java api

摘要：本博文的主要内容如下： .hive的详细官方手册 .hive支持的数据类型 .Hive Shell .Hive工程所需依赖的jar包 .hive自定义函数 .分桶4 .附PPT hive的详细官方手册 http://hive.apache.org/ https://cwiki.apache.org/ 阅读全文

posted @ 2016-10-11 15:54 大数据和AI躺过的坑阅读(3743) 评论(0) 推荐(0) 编辑

2 hive的使用 + hive的常用语法

摘要：本博文的主要内容有： .hive的常用语法 .内部表 .外部表 .内部表，被drop掉，会发生什么？ .外部表，被drop掉，会发生什么？ .内部表和外部表的，保存的路径在哪？ .用于创建一些临时表存储中间结果 .用于向临时表中追加中间结果数据 .分区表(分为，分区内部表和分区外部表) .hive的阅读全文

posted @ 2016-10-10 22:58 大数据和AI躺过的坑阅读(6346) 评论(0) 推荐(0) 编辑

摘要：本博文的主要内容是： .复习HA相关 .MySQL数据库 .先在MySQL数据库中建立hive数据库 .hive的配置以下是Apache Hadoop HA的总结。分为hdfs HA和yarn HA。以上，是参考《Hadoop海量数据处理技术详解与项目实战》强烈建议，先看 Hive的JDBC 阅读全文

posted @ 2016-10-10 09:50 大数据和AI躺过的坑阅读(876) 评论(0) 推荐(0) 编辑

weekend110（Hadoop）的第六天笔记

摘要：（2015年1月25日）课程目录 01-复习ha相关 02-hive的元数据库mysql方式安装配置 03-hive的使用 04-hive的常用语法 05-hql语法及自定义函数 06-hbase表结构 07-hbase集群架构及表存储机制 08-hbase-shell 09-hbase的java 阅读全文

posted @ 2016-10-10 09:35 大数据和AI躺过的坑阅读(231) 评论(0) 推荐(0) 编辑

5 weekend01、02、03、04、05、06、07的分布式集群的HA测试 + hdfs--动态增加节点和副本数量管理 + HA的java api访问要点

摘要：weekend01、02、03、04、05、06、07的分布式集群的HA测试 1） weekend01、02的hdfs的HA测试 2） weekend03、04的yarn的HA测试 1） weekend01、02的hdfs的HA测试首先，分布式集群都是正常的，且工作的然后呢，以上是，weeke 阅读全文

posted @ 2016-09-24 11:40 大数据和AI躺过的坑阅读(474) 评论(0) 推荐(0) 编辑

4 weekend110的hive入门

摘要：查看企业公认的最新稳定版本： https://archive.apache.org/dist/ Hive和HBase都很重要，当然啦，各自也有自己的替代品。在公司里，SQL有局限，大部分时候，不需写mr程序的，用hive这个工具。公司里的懂java开发员工不一定每个公司都有，但懂SQL开发员工很阅读全文

posted @ 2016-09-24 11:11 大数据和AI躺过的坑阅读(359) 评论(0) 推荐(0) 编辑

3 视频里weekend05、06、07的可靠性 + HA原理、分析、机制 + weekend01、02、03、04、05、06、07的分布式集群搭建

摘要：现在，我们来验证分析下，zookeeper集群的可靠性现在有weekend05、06、07 将其一个关掉，分析，这3个zookeeper集群里，杀死了weekend06，还存活weekend05、07。可见，还能正常工作。分析，这3个zookeeper集群里，杀死了weekend06、07，阅读全文

posted @ 2016-09-24 11:07 大数据和AI躺过的坑阅读(196) 评论(0) 推荐(0) 编辑

2 weekend110的zookeeper的原理、特性、数据模型、节点、角色、顺序号、读写机制、保证、API接口、ACL、选举、 + 应用场景：统一命名服务、配置管理、集群管理、共享锁、队列管理

摘要：在hadoop生态圈里，很多地方都需zookeeper。启动的时候，都是普通的server，但在启动过程中，通过一个特定的选举机制，选出一个leader。只运行在一台服务器上，适合测试环境；Zookeeper 的启动脚本在 bin 目录下；在启动脚本之前，还有几个基本的配置项需要配置一下， ti 阅读全文

posted @ 2016-09-24 10:48 大数据和AI躺过的坑阅读(521) 评论(0) 推荐(0) 编辑

1 week110的zookeeper的安装 + zookeeper提供少量数据的存储

摘要：随时查看，zookeeper企业里公认的最新文档版本！ https://archive.apache.org/dist/ 下面是在weekend110上的zookeeper的安装在此之前，先进行快照备份。在这里，为了后续的zookeeper配置需要，在/home/hadoop/下，新建data目阅读全文

posted @ 2016-09-24 09:43 大数据和AI躺过的坑阅读(760) 评论(0) 推荐(0) 编辑

weekend110（Hadoop）的第五天笔记

摘要：（2015年1月24日）课程目录 01-zookeeper1 02-zookeeper2 03-NN高可用方案的要点1 04-hadoop-HA机制的配置文件 05-hadoop分布式集群HA模式部署 06-hdfs--HA测试 07-hdfs--动态增加节点和副本数量管理 08-HA的java 阅读全文

posted @ 2016-09-24 09:35 大数据和AI躺过的坑阅读(226) 评论(0) 推荐(0) 编辑

4 weekend110的textinputformat对切片规划的源码分析 + 倒排索引的mr实现 + 多个job在同一个main方法中提交

摘要：好的，现在，来weekend110的textinputformat对切片规划的源码分析， Inputformat默认是textinputformat，一通百通。这就是今天，weekend110的textinputformat对切片规划的源码分析入口 [LocatedFileStatus{path= 阅读全文

posted @ 2016-09-23 22:21 大数据和AI躺过的坑阅读(388) 评论(0) 推荐(0) 编辑

公告

欢迎您来到《大数据和人工智能躺过的坑》的3D彩色云标签，让您多份关注与留念。微信公众号平台1：大数据躺过的坑微信公众号平台2：今日热点在线微信公众号平台3 ：九哥九嫂小日子大数据和人工智能躺过的坑（总群）： 161156071 更多QQ技术分群，详情请见：http://www.cnblogs.com/zlslch/p/7473861.html

昵称：大数据和AI躺过的坑
园龄： 9年3个月
粉丝： 1315
关注： 39

+加关注

2025年3月

日

一

二

三

四

五

六

大数据和人工智能躺过的坑

随笔分类 - weekend110（Hadoop、MapReduce、Zookeeper、Hive、HBase、flume、sqoop、kafka）

公告

搜索

常用链接

积分与排名

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论