大数据技术原理与应用:【第一讲】大数据概论

 

 

1.1大数据时代

 

第一次浪潮:1980前后,个人计算机,诞生公司:IBM

第二次浪潮:1995前后,互联网普及

第三次浪潮:物联网、云计算、大数据

 

导致大数据时代到来

因素:

技术支撑:

1.存储:存储设备容量不断增加(个人数据不断增加、企业数据越来越多)

2.计算:CPU处理能力大幅提升

3.网络:网络带宽不断增加

经历三个阶段: 

第一阶段:运营式系统阶段

第二阶段:用户原创内容阶段

第三阶段:感知式系统阶段(物联网的大规模普及)

 

大数据发展历程:

 

 

 

1.2 大数据概念和影响

特性:4V

 

 

 1.数据量大:

大数据摩尔定律:每年多增长50%

2.多样化:

结构化数据与非结构化数据

3.快速化:

处理速度非常快;很多企业级应用都需要秒级决策

4.价值密度低:

 

大数据的影响:

1.第四种范式

第一种:实验

第二种:理论

第三种:计算

第四种:数据

2.在思维方式方面,颠覆传统的思维方式

1)全样而非抽样

2)效率而非精确(在第1个基础上)

3)相关而非因果

 

1.3 大数据的应用

影视剧的投拍:大数据分析软件

谷歌预测流感:实时掌握公民搜索相关信息

 

1.4 大数据的关键技术

五个层面:数据采集、(核心)数据存储与管理、数据处理与分析、数据隐私与安全

 

两大核心:分布式存储、分布式处理

 

分布式存储:Google公司为代表

 

大数据的计算模式:

不同的计算模式需要使用不同的产品

 

1.批处理计算:(实时性不够好)

代表产品:MapReduce,Spark

2.流计算:

实时处理、实时响应

3.图计算:

高效处理图结构的数据

4.查询分析计算(交互式查询):

代表:Hive等

 

 

 

1.5 大数据与云计算、物联网

 

云计算:

1.云计算解决问题:

两大核心:分布式存储、分布式处理

2.典型特征:

虚拟化、多用户

3.概念:

通过网络以服务的方式为用户提供非常廉价的IT资源

4.优势:

企业不需要自建IT基础设施,可以租用云端资源

5.三种模式:公有云、混合云、私有云

公有云:面向所有用户

私有云:面向企业内部

混合云:部分给自己、部分给外面

6.三种云服务:

1.IaaS:基础设施即服务

将基础设施作为服务出租

2.PaaS:平台即服务

 用提供的平台资源开发、部署软件

3.SaaS:软件即服务

典型案例:云财务软件

 

7.云计算关键技术:

1.多租户

2.虚拟化:虚拟机、虚拟专用网(VPN)

3.分布式存储

4.分布式计算

 

8.云计算数据中心

数据中心包含有大量刀片服务器

 

数据中心建设位置:

地质构造稳定、天气凉爽

 

慕课链接:https://www.icourse163.org/learn/XMU-1002335004?tid=1003965001#/learn/announce

posted @ 2019-06-08 17:04  musecho  阅读(956)  评论(0编辑  收藏  举报