Hadoop的背景起源二:MapReduce
一、什么是大数据?大数据的本质是?
(1)数据的存储:分布式文件系统(分布式存储) ----》HDFS:Hadoop distributed file system
(2)数据的计算:分布式计算
二、如何解决大数据的计算?分布式计算
(1)什么是PageRank(MapReduce的问题的来源)
(*)搜索排名
(2)MapReduce基础编程模型