摘要:
本文详述了kafka集群的部署。 阅读全文
摘要:
本文详述了Hbase集群的部署。 阅读全文
摘要:
本文描述了sqoop的安装以及使用sqoop实现hdfs和mysql数据库之间的数据导入导出。 阅读全文
摘要:
本文详述了azkaban的安装流程。 阅读全文
摘要:
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。本文描述了HIve的一些基本操作,如有错误之处还请指出! 阅读全文
摘要:
本文基于hadoop2.x架构详细描述了mapreduce的执行过程,包括partition,combiner,shuffle等组件以及yarn平台与mapreduce编程模型的关系。 阅读全文
摘要:
本文主要用于记录自己在编写mapreduce程序时常用的一些方法,后期会不断更新,用于自己复习和给新手一些帮助。 阅读全文
摘要:
本文主要详述了HDFS的组成结构,客户端上传下载的过程,以及HDFS的高可用和联邦HDFS等内容。 阅读全文