摘要: 本文详述了kafka集群的部署。 阅读全文
posted @ 2018-06-13 21:20 py小杰 阅读(654) 评论(0) 推荐(0) 编辑
摘要: storm集群部署 阅读全文
posted @ 2018-06-11 12:01 py小杰 阅读(139) 评论(0) 推荐(0) 编辑
摘要: 本文详述了Hbase集群的部署。 阅读全文
posted @ 2018-06-08 14:20 py小杰 阅读(405) 评论(0) 推荐(0) 编辑
摘要: 本文描述了sqoop的安装以及使用sqoop实现hdfs和mysql数据库之间的数据导入导出。 阅读全文
posted @ 2018-06-03 20:56 py小杰 阅读(359) 评论(0) 推荐(0) 编辑
摘要: 本文详述了azkaban的安装流程。 阅读全文
posted @ 2018-06-03 14:24 py小杰 阅读(654) 评论(1) 推荐(0) 编辑
摘要: Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。本文描述了HIve的一些基本操作,如有错误之处还请指出! 阅读全文
posted @ 2018-06-03 08:46 py小杰 阅读(1604) 评论(4) 推荐(0) 编辑
摘要: Hive安装 阅读全文
posted @ 2018-05-31 22:32 py小杰 阅读(326) 评论(0) 推荐(0) 编辑
摘要: 本文基于hadoop2.x架构详细描述了mapreduce的执行过程,包括partition,combiner,shuffle等组件以及yarn平台与mapreduce编程模型的关系。 阅读全文
posted @ 2018-05-29 09:56 py小杰 阅读(15574) 评论(1) 推荐(4) 编辑
摘要: 本文主要用于记录自己在编写mapreduce程序时常用的一些方法,后期会不断更新,用于自己复习和给新手一些帮助。 阅读全文
posted @ 2018-05-17 10:24 py小杰 阅读(1210) 评论(0) 推荐(0) 编辑
摘要: 本文主要详述了HDFS的组成结构,客户端上传下载的过程,以及HDFS的高可用和联邦HDFS等内容。 阅读全文
posted @ 2018-05-06 13:40 py小杰 阅读(4752) 评论(1) 推荐(2) 编辑