大数据概述
今天是接触大数据课程的第一天。重新认识了一下大数据的特点和魅力!大数据的特点就是:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。当数据通过软件处理之后再呈现出来,总是会有不一样的三维图形或者是一定有趣的图案,着实让人着迷!接下来,让我们来浅谈一些特点吧!
1、试述大数据对思维方式的重要影响。
大数据是最近开始受人们关注和讨论的话题,大数据这个新概念一出现就受到了人们极大的热捧。互联网开启了新的生活方式,带给了人们极大的便利,计算机技术的发展为收集和分析大量的数据提供了可能,在互联网时代每浏览一个网页,每敲击一下键盘,都能变成为大数据的一部分。从《大数据带来的四种思维》里我们可以知道,大数据给我们带来了:总体思维、容错思维、相关思维、智能思维。
第一种思维影响:不是随机样本,而是总体数据。《大数据时代》一书提醒读者,随着计算机技术的进步,得到并分析大数据成为可能,大数据较之以往的统计样本就是全数据,大数据有几个特征,首先是规模大,比如说YouTube、Facebook,每天在数据处理、数据存储量能远超过历史的数据,所以规模大是其基本特征;第二个特征就是种类繁多。除了传统数据库、数据仓库处理的结构化数据以外,其实很多半结构化,甚至是说非结构化的数据在大数据处理当中都变成非常重要的原材料。尤其是像话音、视频、文本等等,这些原来并不是机器所能识别处理的。而在大数据时代这是基本要求;第三个特征就是处理速度要提高。传统上来说分析型系统某种意义上是一个非实时、后台型的系统,但是现在很多应用它实际上要求联机分析、在线分析,对于实时性要求就会有很大提高。这带来了观察和分析事物的角度变化。他们可以预测一个经济体的健康性和增长性。
第二种思维影响:不是精确性,而是混杂性。大数据的简单算法是一种统计学的逻辑,这个如同热力学的分析模式,热力学并不关心具体的分子运动,而是关心温度、体积、压强之间的宏观联系,只有真正理解了大数据基于统计学的思维方式,才能理解它的独特优势和局限。这种方式可以解决以往技术无法解决的大范围、实时性和并行处理等问题,并带来新的洞见,它用概率说话,并不是就细节较真。这个观念是,希望先解决80%的趋势问题,然后慢慢精细化。另外,大数据的一大优点就是数据可以被重复使用。
第三种思维影响:不是因果关系,而是相互关系。大数据关注“是什么”,而不是“为什么”,这符合中国人长久以来的思维习惯,并不追求其内在的原理,机理,而重点关注它的结果和趋势,就像人们使用计算机一样,不必在意计算机的工作原理,内部的电路分布,只需要输入指令,就能得到想要的结果。
第四种思维变化:不是自动化,而是智能化。不断提高机器的自动化、智能化水平始终是人类社会长期不懈努力的方向。计算机的出现极大地推动了自动控制、人工智能和机器学习等新技术的发展,“机器人”研发也取得了突飞猛进的成果并开始一定应用。大数据时代的到来,可以为提升机器智能带来契机,因为大数据将有效推进机器思维方式由自然思维转向智能思维,这才是大数据思维转变的关键所在、核心内容。
2、详细阐述大数据、云计算、物联网之间的区别与联系。
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。云计算(cloud computing)是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云是网络、互联网的一种比喻说法。过去在图中往往用云来表示电信网,后来也用来表示互联网和底层基础设施的抽象。因此,云计算甚至可以让你体验每秒10万亿次的运算能力,拥有这么强大的计算能力可以模拟核爆炸、预测气候变化和市场发展趋势。用户通过电脑、笔记本、手机等方式接入数据中心,按自己的需求进行运算。而物联网是新一代信息技术的重要组成部分,也是“信息化”时代的重要发展阶段。其英文名称是:“Internet of things(IoT)”。顾名思义,物联网就是物物相连的互联网。这有两层意思:其一,物联网的核心和基础仍然是互联网,是在互联网基础上的延伸和扩展的网络;其二,其用户端延伸和扩展到了任何物品与物品之间,进行信息交换和通信,也就是物物相息。物联网通过智能感知、识别技术与普适计算等通信感知技术,广泛应用于网络的融合中,也因此被称为继计算机、互联网之后世界信息产业发展的第三次浪潮。物联网是互联网的应用拓展,与其说物联网是网络,不如说物联网是业务和应用。因此,应用创新是物联网发展的核心,以用户体验为核心的创新2.0是物联网发展的灵魂。同时,这三者的关系都基于互联网的基础,三者均有包含关系。物联网对应了互联网的感觉和运动神经系统。云计算是互联网的核心硬件层和核心软件层的集合,也是互联网中枢神经系统萌芽。大数据代表了互联网的信息层(数据海洋),是互联网智慧和意识产生的基础。包括物联网,传统互联网,移动互联网在源源不断的向互联网大数据层汇聚数据和接受数据。云计算与物联网推动大数据发展。
3、简述你对大数据应用与发展的看法,以及你在这次大数据浪潮中想扮演什么角色。
在我看来大数据是相当完美的一次数字的挖掘与利用。是数学在数学史上一次很好的体现和发展,统计学,概率论等。从历史发展上看,作为一名入门的数学爱好者,我是非常看好大数据的发展,并相信她能够在新的时代发挥正面的作用。同时也更能充分发挥各大软件的功能。如果可以,我希望我自己在这次大数据潮流中能够学到正确的大数据观念并能合理的利用大数据作出有利于自己以及社会的事情出来。如果,再有能力,将大数据发展成为数学的一个新的分支!