摘要:
大数据的定义 大数据是指无法在一定时间范围内用常规软件工具无法捕捉、管理和处理的数据集合,是需要处理模式才能具有更强的决策力、洞察发现力、和流程优化能力的海量、高增长率和多样化的信息资产。 大数据的特点 大数据的特点可以用 IBM 曾经提出的 “5V” 来描述,如下: 大量 Volume 采集、存储 阅读全文
摘要:
什么是Hadoop Hadoop 是一个适合大数据的分布式存储和计算平台。 Hadoop有广义与狭义之分: 狭义的Hadoop: 指的是一个框架,Hadoop是由三部分组成: HDFS:分布式文件系统--》存储;MapReduce:分布式离线计算框架--》计算;Yarn:资源调度框架 广义的Hado 阅读全文