大数据第三课

第三课:Hadoop的背景起源二:MapReduce

一、什么是大数据,本质?
(1)数据的存储:分布式文件系统(分布式存储)-----> HDFS: Hadoop Distributed File System
(2)数据的计算:分布式计算

二、如何解决大数据的计算?分布式计算
(1)什么是PageRank(MapReduce的问题的来源)
(*) 搜索排名

(2)MapReduce(Java语言实现)基础编程模型: 把一个大任务拆分成小任务,再进行汇总

 

 

————————————————
版权声明:本文为CSDN博主「阳沐之」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_35385687/article/details/94161024

posted @ 2021-03-01 10:13  GoodGad  阅读(55)  评论(0编辑  收藏  举报
Live2D