《大数据技术原理与应用》暑假学习计划_01 - 什么是大数据
《大数据技术原理与应用》第一周学习计划
什么是大数据?
首先什么是大数据?书籍内容从4V角度解释了什么是大数据:Velocity快速化,Variety多样化,Value价值密度低(商业价值高),Volume大量化
从数据角度来分大数据分为:结构化数据与非结构化数据,而其中的结构化数据就是我们常说也常用的数据库中的数据。
大数据的两大核心技术:分布式存储与分布式处理
大数据的四种计算方式:批处理计算,流计算(流数据处理),图计算,查询分析计算。
大数据时代给我们的思维方式带来的改变:
- 全样而非抽样(即全样分析)
- 效率而非精确,不存在抽样时出现的误差放大现象
- 相关而非因果
什么是云计算?
云计算的云服务分为三种:
- SaaS,面向用户。
- PaaS,面向应用开发者。
- IaaS,面向网络架构师。
而大数据正是继承于云计算。
大数据,云计算,物联网三者的关系?
从整体上看,大数据、云计算和物联网这三者是相辅相成的。大数据根植于云计算,大数据分析的很多技术都来自于云计算,云计算的分布式和数据存储和管理系统(包括分布式文件系统和分布式数据库系统)提供了海量数据的存储和管理能力,分布式并行处理框架MapReduce提供了海量数据分析能力,没有这些云计算技术作为支撑,大数据分析就无从谈起。反之,大数据为云计算提供了“用武之地”,没有大数据这个“练兵场”,云计算技术再先进,也不能发挥它的应用价值。
物联网的传感器源源不断产生的大量数据,构成了大数据的重要来源,没有物联网的飞速发展,就不会带来数据产生方式的变革,即由人工产生阶段向自动产生阶段,大数据时代也不会这么快就到来。同时,物联网需要借助于云计算和大数据技术、实现物联网大数据的存储、分析和处理。
云计算、大数据和物联网,三者会继续相互促进、相互影响,更好地服务于社会生产和生活的各个领域。
(来源于:物联传媒,如有侵权联系删除。)