摘要: 大数据的定义 大数据是指无法在一定时间范围内用常规软件工具无法捕捉、管理和处理的数据集合,是需要处理模式才能具有更强的决策力、洞察发现力、和流程优化能力的海量、高增长率和多样化的信息资产。 大数据的特点 大数据的特点可以用 IBM 曾经提出的 “5V” 来描述,如下: 大量 Volume 采集、存储 阅读全文
posted @ 2020-06-30 23:08 若冲 阅读(354) 评论(0) 推荐(0) 编辑
摘要: 什么是Hadoop Hadoop 是一个适合大数据的分布式存储和计算平台。 Hadoop有广义与狭义之分: 狭义的Hadoop: 指的是一个框架,Hadoop是由三部分组成: HDFS:分布式文件系统--》存储;MapReduce:分布式离线计算框架--》计算;Yarn:资源调度框架 广义的Hado 阅读全文
posted @ 2020-06-30 21:56 若冲 阅读(157) 评论(0) 推荐(0) 编辑