Hadoop项目结构

HDFS:分布式存储

YARN:计算资源调度

MapReduce:离线计算(基于磁盘)

Tez:构建有向无环图

Spark:基于内存计算

Hive:数据仓库(历史记录)

Pig:流数据处理(轻量级的脚本语言)

Oozie:作业流调度系统

Zookeeper:分布式协调服务

HBase:列族数据库

Flume:日志收集分析框架

Sqoop:数据导入导出

Ambari:部署工具

 

posted @ 2023-06-18 21:56  会秃头的小白  阅读(22)  评论(0编辑  收藏  举报