【大数据相关】认识Hadoop
Hadoop ? 怎么念 ,于是就中文译了下:哈杜bu
学习来自: 慕课网--大数据--认识Hadoop 基础篇
笔记: 什么是Hadoop ? Hadoop 是什么?
Hadoop 是Apache开源的一个分布式并行处理的平台 (分布式存储+ 分布式计算平台)
Hadoop 的两个核心组成:
HDFS: 分布式文件系统,存储海量数据
MapReduce: 并行处理框架,实现任务分解和调度
Hadoop 的生态系统
Hive: 简称 "小蜜蜂",不用写Hadoop 程序,只需要写sql Hive就会给我们转换成Hadoop 程序去执行,降低了 Hadoop 的使用门槛
HBase:存储结构化数据的分布式数据库
ZooKeePer:动物园管理员 管理监控整个集群的各个节点的状态,监控每个集群的配置
Hadoop的安装:
linux 安装java jdk 配置 ,然后下载Hadoop包 进行配置
小贴士: 怎么有linux 操作系统呢?
方法一: 在window系统下 安装虚拟机,在虚拟机 里安装 linux 操作系统
方法二:购买云主机,阿里云、腾讯云等