大数据概述

一、大数据时代

1.1 第三次信息化浪潮

IT领域每隔十五年就会迎来一次重大变革,信息科技为大数据时代提供技术支撑:

  • 存储设备容量不断增加

  • CPU处理能力大幅提升

  • 网络带宽不断增加

1.2 数据产生方式的变革:

1.3 大数据的发展历程 :

二、大数据概念

2.1 数据量大

  • 根据IDC作出的估测,数据一直都在以每年50%的速度增长,也就是说每两年就增长一倍(大数据摩尔定律)

  • 人类在最近两年产生的数据量相当于之前产生的全部数据量

  • 预计到2020年,全球将总共拥有35ZB的数据量,相较于2010年,数据量将增长近30倍

2.2 数据类型繁多

  • 大数据是由结构化和非结构化数据组成的。

  • 10%的结构化数据,存储在数据库中,90%的非结构化数据,它们与人类信息密切相关。

2.3 处理速度快

  • 从数据的生成到消耗,时间窗口非常小,可用于生成决策的时间非常少 。

  • 1秒定律:这一点也是和传统的数据挖掘技术有着本质的不同 。

2.4 价值密度低

  • 价值密度低,商业价值高

  • 例如连续不间断监控过程中,可能有用的数据仅仅有一两秒,但是具有很高的商业价值

三、大数据影响

图灵奖获得者、著名数据库专家Jim Gray 博士观察并总结人类自古以来,在科学研究上,先后历经了实验、理论、计算和数据四种范式。

在思维方式方面,大数据完全颠覆了传统的思维方式:

  • 全样而非抽样、效率而非精确、相关而非因果。

  • 在社会发展方面,大数据决策逐渐成为一种新的决策方式,大数据应用有力促进了信息技术与各行业的深度融合,推动了新技术和新应用的不断涌现。

  • 在就业市场方面,大数据的兴起使得数据科学家成为热门职业 。

  • 在人才培养方面,大数据的兴起,将在很大程度上改变中国高校信息技术相关专业的现有教学和科研体制。

  • 大数据无处不在,包括金融、汽车、零售、餐饮、电信、能源、政务、医疗、体育、娱乐等在内的社会各行各业都已经融入了大数据的印迹。

四、大数据关键技术

两大核心技术:分布式存储、分布式处理

五、大数据计算模式

六、大数据产业

大数据产业是指一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合

七、大数据与云计算、物联网的关系

云计算、大数据和物联网代表了IT领域最新的技术发展趋势,三者既有区别又有联系。

八、总结

  • 大数据具有数据量大、数据类型繁多、处理速度快、价值密度低等特点,统称“4V”。

  • 大数据对科学研究、思维方式、社会发展、就业市场和人才培养等方面,都产生了重要的影响。

  • 大数据在金融、零售、餐饮、医疗、体育、娱乐等在内的社会各行各业都得到了日益广泛的应用,深刻地改变着我们的社会生产和日常生活。

  • 大数据并非单一的数据或技术,而是数据和大数据技术的综合体。大数据技术主要包括数据采集、数据存储和管理、数据处理与分析、数据安全和隐私保护等几个层面的内容 。

  • 大数据产业包括IT基础设施层、数据源层、数据管理层、数据分析层、数据平台层和数据应用层 。

九、参考资料

《大数据技术原理与应用——概念、存储、处理、分析与应用(第二版)》

posted on 2022-02-16 01:12  lixin05  阅读(701)  评论(0编辑  收藏  举报