大数据管理系统--hadoop是如何工作的

1.分布式文件系统（3种类型的节点构成，一是大量的普通的数据节点构成一个集群，二是MASTER命名服务器，包括要管理文件由多少个数据块，这些数据块存放在哪个节点上，以及文件访问权限，都在这里定义。三是资源管理的zookeeper，包括目录管理，节点状态的监控）

2.存储管理-Nosql数据库。这个层面的节点服务器我们称之为分片服务器，负责数据分片的读取，便于用户进行数据的交互，MASTER节点负责分片，如何进行分片，放到哪一个分片服务器上去。

3.计算引擎层。MASTER负责接收一个任务，然后怎么把这个任务进行划分，然后调度这个任务的执行，而集群里的各个节点，负责计算任务的实施

每一层的系统，都不一定部署在同一个集群，刚才我们看到好像是在同一集群部署，实际上存储的集群和计算的集群是可以分离的。即：数据放在一个集群上，计算可以在另外一组集群上。在逻辑上在道理上都是可以的。但为了性能的考虑，通常这些不同层上系统的部署是在同一集群的。并且任务的计算节点，和任务所需要处理的数据节点，通常安排在同一台服务器上。这样的好处，就是减少数据的移动，减少网络传输的压力。特别是低速磁盘的访问开销，

在同一个集群下，我们对不同的大数据系统还要进行高效的资源管理，也有相应的软件来负责，在appche hadoop中，这个软件是yarn。

posted @ 2022-12-31 11:43 -空降兵- 阅读(64) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· 数据湖，“大水池一湖尽收”

· hdfs小文件是啥意思

· 大数据介绍

· Hadoop入门(1)——Hadoop概论

· 大数据分布式处理系统平台Hadoop的主要特征

阅读排行：
· 开源Multi-agent AI智能体框架aevatar.ai，欢迎大家贡献代码
· Manus重磅发布：全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后，我竟然真的恢复了删除的微信聊天记录！
· 没有Manus邀请码？试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY

公告

昵称： -空降兵-
园龄： 3年7个月
粉丝： 2
关注： 3

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:2020欧洲杯足球赛规则里的排列组合问题
m
--DATA_MONK
2. Re:用户和账户都是什么意思
作者理解只能说有那么点意思。用户概念的理解：用户就是使用者，可以是个人用户，也可以是机构用户。账户概念的理解：账户，所谓“账”，就是系统根据“账”来存储和管理数据，类似记账、做账这样的概念。例...
--liaowenxiong
3. Re:从具象到抽象，从感性认识到理性归纳---这才是符合人类学习的正确路线
牛逼！
--王浩宇Albert233