大数据概述

1.试述大数据对思维方式的重要影响:

随着时代的发展信息时代已经来到第三次的浪潮:信息大爆发。如今的世界网络发达且遍布广人们很容易就利用自己身边的移动终端如手机和电脑产生大量数据,比如你用电脑搜索一些关键字或者利用手机的app如:微信、美团等娱乐休闲的软件、支付宝支付为你自己服务的同时也会产生大量的数据返回给终端,所以说现在我们也是大数据的提供者之一。我认为大数据给我们带来的思维改变有三处:

第一个思维变化:不是随机样本,而是全体数据。《大数据时代》一书提醒读者,随着计算机技术的进步,得到并分析大数据成为可能,大数据较之以往的统计样本就是全数据,大数据有几个特征,首先是规模大,比如说YouTube、Facebook,每天在数据处理、数据存储量能远超过历史的数据,所以规模大是其基本特征;第二个特征就是种类繁多。除了传统数据库、数据仓库处理的结构化数据以外,其实很多半结构化,甚至是说非结构化的数据在大数据处理当中都变成非常重要的原材料。

第二个思维变化:不是精确性,而是混杂性。

第三个思维变化:不是因果关系,而是相互关系。大数据关注“是什么”,而不是“为什么”,这符合中国人长久以来的思维习惯,并不追求其内在的原理,机理,而重点关注它的结果和趋势,就像人们使用计算机一样,不必在意计算机的工作原理,内部的电路分布,只需要输入指令,就能得到想要的结果。经常网购的人会更容易体会。很多电商网站的推荐引擎具备这种能力,它能够在顾客购物的时候,推荐顾客喜欢的其他物品,顾客可能不知道“为什么”,其实网站也不在乎“为什么”。但是网站根据成千上万甚至上亿人的统计学分析,就可以发现“关联物”,或者说大数据更擅长通过统计分析人类所不能感知的关联,并建议人采取行动。

2.详细阐述大数据、云计算、物联网之间的区别与联系。

三者区别:

1.物联网是互联网大脑的感觉神经系统
因为物联网重点突出了传感器感知的概念,同时它也具备网络线路传输,信息存储和处理,行业应用接口等功能。而且也往往与互联网共用服务器,网络线路和应用接口,使人与人(Human ti Human ,H2H),人与物(Human to thing,H2T)、物与物( Thing to Thing,T2T)之间的交流变成可能,最终将使人类社会、信息空间和物理世界(人机物)融为一体
2.云计算是互联网大脑的中枢神经
在互联网虚拟大脑的架构中,,互联网虚拟大脑的中枢神经系统是将互联网的核心硬件层,核心软件层和互联网信息层统一起来为互联网各虚拟神经系统提供支持和服务,从定义上看,云计算与互联网虚拟大脑中枢神经系统的特征非常吻合。在理想状态下,物联网的传感器和互联网的使用者通过网络线路和计算机终端与云计算进行交互,向云计算提供数据,接受云计算提供的服务。
3.大数据是互联网智慧和意识产生的基础
随着博客、社交网络、以及云计算、物联网等技术的兴起,互联网上数据信息正以前所未有的速度增长和累积。互联网用户的互动,企业和政府的信息发布,物联网传感器感应的实时信息每时每刻都在产生大量的结构化和非结构数据,这些数据分散在整个互联网网络体系内,体量极其巨大。这些数据中蕴含了对经济,科技,教育等等领域非常宝贵的信息[52]。这就是互联网大数据兴起的根源和背景。

三者联系:

1.物联网产生大数据,大数据助力物联网。2.大数据是高速跑车,云计算是高速公路。3.云计算是物联网发展的基石,并且从两个方面促进物联网的实现。首先,云计算是实现物联网的核心,运用云计算模式使物联网中以兆计算的各类物品的实时动态管理和智能分析变得可能。物联网通过将射频识别技术、传感技术、纳米技术等新技术充分运用在各行业之中,将各种物体充分连接,并通过无线网络将采集到的各种实时动态信息送达计算机处理中心进行汇总、分析和处理。

3.简述你对大数据应用与发展的看法,以及你在这次大数据浪潮中想扮演什么角色。
大数据技术的研究发展现状: 
  当前大数据技术的研究发展状况主要体现在基础理论、关键技术、应用实践、数据安全等四个方面。在基础理论方面,目前相关专家与研究人员尚未解决一些基本的理论问题。例如当前学界对于大数据技术的科学定义、结构模型、数据理论体系等基本问题并未有确切的认识和判定标准,在数据质量和数据计算效率的评估活动中,也缺乏一个统一的标准,这就直接造成了技术人员在数据质量评价活动中工作效率低下的问题。在关键技术研究方面,大数据格式的转化、数据转移和处理等问题技术亟需处理的核心问题。大数据由于其异构性和异质性的特征,这就说明提高大数据格式转化的效率成为了增加大数据技术应用家价值的必经途径;而提升大数据计算能力的关键在于提高数据的转移速率,这就要求技术人员要及时对大数据进行整合与处理。在大数据的处理中,数据的重组与错误数据的再利用都是有效提高大数据应用价值的措施。在应用实践研究方面,目前大数据在实际中的研究应用主要体现为数据管理、数据搜索分析和数据集成。其中,数据管理主要用于大型互联网数据库和新型数据储存模型与集成系统中,而数据搜索分析则多用于模型社交网络中,数据集成则通过将不同来源不同作用的数据进行整合从而开发出整体数据库新的功能,目前正处于研究发展的起始阶段。最后,在数据安全方面,大数据技术的用户隐私和数据质量问题是当前数据安全研究工作的重点。一方面,大数据技术下用户隐私更容易被获取,信息泄露风险更大;另一方面,大数据由于在准确性、冗余性、完整性等方面的偏差,数据质量问题不可避免,亟需开发应用相应的数据自动检测修复系统。

我想在大数据时代中除了像平常人们一样扮演一个大数据样本的提供者之外还想利用自己学习到的知识去担任大数据的处理和分析者,收集大数据样本作出现有数据的分析去预测未来的发展,比如利用用户的搜索总结出搜索热词等等。



posted @ 2018-03-05 10:01  118郭耀文  阅读(252)  评论(0编辑  收藏  举报