第一篇博客

1.2018年微信每天有450亿次信息发送出,有4.1亿次音视频呼叫成功。微信、微博、小视频每天产生大概几TB的数据量,主要基本是信息,图片,视频,语音等数据。

2.

在体育和娱乐方面,大数据可以帮助我们训练球队,决定投拍那种题材的影视作品,以及预测比赛结果。

例如,大数据与数据分析在欧洲职业足球的应用案例中。

国外的 Hugo Mathien 通过对一批欧洲职业足球统计的原始数据进行清洗,并把一些洞察结果分享出来。他使用的数据包含了2008年至2011年的25,000多场比赛,来自11个国家的超过10,000名球员,以及多达10家数据提供商的投注赔率。

过程中,Hugo 使用Python Scrapy从多个来源中提取数据,克服了数据完整性问题,并手动构建了数据集 - 数据集采用SQL数据库的形式。这个数据集包含比赛统计,即分数、角球、犯规等、球队的出场阵容/阵型,并收录了各个球员名字与他们在每次比赛时在球场上的位置。

数据集的原始数据中也导入了来自EA Sports足球游戏的数据,比如足球员的35个属性数据。举个例子,如果某个球员在一段时间内表现不佳,他在国际足联中的统计数据会受到影响,通常在数据集中会看到相同的更新。

 

3.大数据:大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

人工智能:人工智能(Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人智能的理论、方法、技术及应用系统的一门新技术科学。人工智能领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

云计算:云计算(cloud computing)是分布式计算的一种,指的是通过网络“云”将巨大的数据计算处理程序分解成无数个小程序,然后,通过多部服务器组成的系统进行处理和分析这些小程序得到结果并返回给用户。

物联网:物联网(英文:Internet of Things,缩写:IoT)起源于传媒领域,是信息科技产业的第三次革命。物联网是指通过信息传感设备,按约定的协议,将任何物体与网络相连接,物体通过信息传播媒介进行信息交换和通信,以实现智能化识别、定位、跟踪、监管等功能。

区块链:区块链是一个信息技术领域的术语。从本质上讲,它是一个共享数据库,存储于其中的数据或信息,具有“不可伪造”“全程留痕”“可以追溯”“公开透明”“集体维护”等特征。

相互关系:

首先,大数据是物联网和云计算发展到一定阶段的必然结果,物联网为大数据提供了大部分的数据来源,而云计算则为大数据提供了支撑平台。

大数据又是人工智能的重要基础,人工智能需要通过大数据完成学习和决策的过程。从整个智能系统的体系结构来看,物联网是触角,云计算是支撑平台,大数据提供数据分析,人工智能完成最终的决策。

区块链技术未来与大数据技术的结合应用将会带来一系列重要的改变,区块链技术本身就是一种数据存储方式,而且区块链存取的数据具有较强的安全性和防篡改特性,大数据与区块链的结合还能解决数据价值化过程中的“确权”问题和流通问题,可以说未来大数据与区块链的结合将更加紧密。

4.近几年来,大数据这个词突然变得很火,不仅纳入阿里巴巴、谷歌等。互联网公司的战略规划中,同时也在我国国务院和其他国家的政府报告中多次提及,大数据无疑成为当今互联网世界中的新宠儿。在时下商界的流行语中,很难找出一个比“大数据”更吸引眼球的术语了。大数据的颠覆和创新作用几乎在每个行业都有体现。

当前,大部分中国企业在数据基础系统架构和数据分析方面都面临着诸多挑战。根据产业信息网调查,目前国内大部分企业的系统架构在应对大量数据时均有扩展性差、资源利用率低、应用部署复杂、运营成本高和高能耗等问题。国内企业为适应大数据时代而做出大规模调整是一种必然,这为国内从事大数据相关业务的IT企业带来了极大市场需求。

posted @ 2020-09-11 11:34  兲乤  阅读(128)  评论(0编辑  收藏  举报