【大数据相关】认识Hadoop

Hadoop ?  怎么念 ,于是就中文译了下:哈杜bu

学习来自: 慕课网--大数据--认识Hadoop 基础篇

 

笔记: 什么是Hadoop ? Hadoop  是什么?

Hadoop  是Apache开源的一个分布式并行处理的平台 (分布式存储+ 分布式计算平台)

 

Hadoop  的两个核心组成:

HDFS: 分布式文件系统,存储海量数据

MapReduce: 并行处理框架,实现任务分解和调度

 

Hadoop 的生态系统

Hive: 简称 "小蜜蜂",不用写Hadoop 程序,只需要写sql    Hive就会给我们转换成Hadoop 程序去执行,降低了 Hadoop 的使用门槛

HBase:存储结构化数据的分布式数据库

ZooKeePer:动物园管理员 管理监控整个集群的各个节点的状态,监控每个集群的配置

 

Hadoop的安装:

linux 安装java jdk 配置 ,然后下载Hadoop包 进行配置

 

小贴士: 怎么有linux 操作系统呢?

方法一: 在window系统下 安装虚拟机,在虚拟机 里安装 linux 操作系统

方法二:购买云主机,阿里云、腾讯云等

 

posted @ 2019-09-09 19:50  初学者,方圆几里  阅读(204)  评论(0编辑  收藏  举报