作业:大数据概述与学习资源

1.了解微信、微博、小视频每天产生的数据量与数据类型。
微信、微博、小视频每天产生大概几TB的数据量,主要基本是信息,图片,视频,语音等数据。

2.选择一个你感兴趣的领域应用数据思维进行分析决策的案例。
关于大数据的定义,麦肯锡全球研究所给出的答案是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。它的用途实在是太广泛了,通过各种采集、分析、挖掘的技术,最后获得各种预测,提供决策信息支持。

3.大数据 人工智能 云计算 物联网 区块链的概念及相互关系。
大数据:需要应对海量化和快增长的存储,能够弹性扩张存储容量,这种情况下出现了数据组织技术。大数据形成的数据组织技术必须能够有效将没有价值的数据剔除,同时还要将结构化数据、非结构化数据、业务系统实时采集数据等以分布式数据库、关系型数据库、费关系型数据库等数据存储计算技术进行分类存储与处理,使得数据研发计算与应用能够真正服务于企业内部决策与生产指导。

人工智能:组织好数据,接下来就需要深度挖掘数据,但是面对这样的海量数据,人类的大脑已经处理不过来了,于是人类将各种意义转化为算法交给机器,让机器自行决策,最终给我们提供一个收敛的结果,就有了有效信息。很少关心数据,真正关心的是数据背后的信息。人工智能帮助人类在海量数据中找到了有用的信息,于是便有了各种意义的存在,为我们在进行数字新经济建设的过程中指明了出路和方向。

云计算:本质上是将具备一定规模的物理资源转化为服务的形式提供给用户,用户不需要见到物理机器,自然不需要考虑各种运维的事情。如果用户通过这种可计量的服务形式使用物理机器,就会越来越关注自身业务本身,因为使用数据化的门槛会越来越低,有了云计算在底层撑腰,将物理世界的业务转化到数据的速度会越来越快,以至于必须找到新的技术来组织这些数据。

物联网:物联网简单来讲就是“物物相连的互联网”,使用信息传感物理设备按照约定的协议把任何物品与互联网连接起来进行信息交换的网络,以实现物理生产环境的智能化识别、定位、跟踪、监控和管理。

区块链:在信息化的进程中,人的信念是不可靠的一环,在面临因中心化架构带来各种弊端与问题时,提出了区块链技术,简单的说就是利用分布式网络+非对称加密算法将已经形成的信息有效的串联起来,保证信息是达成人们共识的还不可修改。

这几者的关系比较明确,物联网是执行端,是为人工智能和云服务提供服务的应用。

4.数据的职业前景。
近几年来,大数据这个词突然变得很火,不仅纳入阿里巴巴、谷歌等。互联网公司的战略规划中,同时也在我国国务院和其他国家的政府报告中多次提及,大数据无疑成为当今互联网世界中的新宠儿。在时下商界的流行语中,很难找出一个比“大数据”更吸引眼球的术语了。大数据的颠覆和创新作用几乎在每个行业都有体现。
当前,大部分中国企业在数据基础系统架构和数据分析方面都面临着诸多挑战。根据产业信息网调查,目前国内大部分企业的系统架构在应对大量数据时均有扩展性差、资源利用率低、应用部署复杂、运营成本高和高能耗等问题。国内企业为适应大数据时代而做出大规模调整是一种必然,这为国内从事大数据相关业务的IT企业带来了极大市场需求。

posted @ 2020-09-11 11:02  ZHANHUO  阅读(203)  评论(0编辑  收藏  举报