大数据和云计算的关系
1、什么是大数据
百度百科描述:大数据(bigdata)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
IBM提出了大数据的5V特征:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实性)。
个人理解:大数据是在信息数据爆炸时代,为了更经济地从高频率获取的、大容量的、不同结构和类型的数据中获取价值,而设计的新一代技术架构,是必须的思想变革,技术革新。
2、什么是云计算
百度百科描述:云计算(cloudcomputing)是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。现阶段广为接受的是美国国家标准与技术研究院(NIST)定义:云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问, 进入可配置的计算资源共享池(资源包括网络,服务器,存储,应用软件,服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。
个人理解:目前大多数说的云计算通常是指对硬件资源(计算、内存、存储、网络)的通过虚拟化资源整合,即云计算三层模型中的Iaas层。
3、那么大数据和云计算什么关系呢
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式计算架构。它的特色在于对海量数据的挖掘,但它必须依托云计算的分布式处理、分布式数据库、云存储和虚拟化技术。