Hadoop项目结构
HDFS:分布式存储
YARN:计算资源调度
MapReduce:离线计算(基于磁盘)
Tez:构建有向无环图
Spark:基于内存计算
Hive:数据仓库(历史记录)
Pig:流数据处理(轻量级的脚本语言)
Oozie:作业流调度系统
Zookeeper:分布式协调服务
HBase:列族数据库
Flume:日志收集分析框架
Sqoop:数据导入导出
Ambari:部署工具
HDFS:分布式存储
YARN:计算资源调度
MapReduce:离线计算(基于磁盘)
Tez:构建有向无环图
Spark:基于内存计算
Hive:数据仓库(历史记录)
Pig:流数据处理(轻量级的脚本语言)
Oozie:作业流调度系统
Zookeeper:分布式协调服务
HBase:列族数据库
Flume:日志收集分析框架
Sqoop:数据导入导出
Ambari:部署工具