|NO.Z.00003|——————————|BigDataEnd|——|Hadoop&Hadoop核心框架.V03|——|Hadoop.v02|大数据定义|应用场景|

一、大数据的定义
### --- 大数据定义

~~~     大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,
~~~     是需要新处理模式才能具有更强的决策力、
~~~     洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
二、大数据的特点
### --- 大数据的特点

~~~     大数据的特点可以用 IBM 曾经提出的 “5V” 来描述,如下:
### --- 大量
~~~     采集、存储和计算的数据量都非常大。
~~~     计算机存储单位一般用B,KB,MB,GB,TB,PB,EB,ZB,YB,BB、NB、DB来表示,它们之间的关系是

——>        1GB = 1024 MB
——>        1TB = 1024 GB
——>        1PB = 1024 TB
——>        1EB = 1024 PB
——>        1ZB = 1024 EB
——>        1YB = 1024 ZB
——>        1BB = 1024 YB
——>        1NB = 1024 BB
——>        1DB = 1024 NB
### --- 以PB为例,PB级数据量有多大?是怎样的一个概念?

~~~     假如手机播放MP3的速度为平均每分钟1MB,而1首歌曲的平均时长为4分钟,
~~~     那么1PB存量的歌曲可以连续播放2000年。
### --- 1PB 也相当于50%的全美学术研究图书馆藏书咨询内容。

~~~     1、1986年,全球只有0.02EB也就是约21000TB的数据量
~~~     2、2007年,全球就是280EB也就是约300000000TB的数据量,翻了14000倍
~~~     3、近些年,由于移动互联网及物联网的出现,各种终端设备的接入,各种业务形式的普及,平均每40个月,全球的数据量就会翻倍!2012年,每天会产生2.5EB的数据量
~~~     4、基于IDC的报告预测,从2013年到2020年,全球数据量会从4.4ZB猛增到44ZB!而到了2025年,全球会有163ZB的数据量!
~~~     5、全球的数据量已经大到爆了!而传统的关系型数据库根本处理不了如此海量的数据!
~~~     # 高速
~~~     在大数据时代,数据的创建、存储、分析都要求被高速处理,
~~~     比如电商网站的个性化推荐尽可能要求实时完成推荐,
~~~     这也是大数据区别于传统数据挖掘的显著特征。
        
~~~     # 多样
~~~     数据形式和来源多样化。包括结构化、半结构化和非结构化数据,
~~~     具体表现为网络日志、音频、视频、图片、地理位置信息等等,
~~~     多类型的数据对数据的处理能力提出了更高的要求。
~~~     # 真实
~~~     确保数据的真实性,才能保证数据分析的正确性
        
~~~     # 低价值
~~~     数据价值密度相对较低,或者说是浪里淘沙却又弥足珍贵。
~~~     互联网发展催生了大量数据,信息海量,但价值密度较低,
~~~     如何结合业务逻辑并通过强大的机器算法来挖掘数据价值,
~~~     是大数据时代最需要解决的问题,也是一个有难度的课题。
三、大数据的应用场景
### --- 大数据应用场景概述

~~~     随着大数据的发展,大数据技术已经广泛应用在众多行业,
~~~     比如仓储物流、电商零售、汽车、电信、生物医学、人工智能、智慧城市等等领域,
~~~     包括在疫情防控战中,大数据技术也发挥了重要的作用。
### --- 仓储物流

~~~     大数据技术驱动了仓储物流领域的智能化发展,以苏宁为例,
~~~     苏宁物流可在全国的各级仓库间实现智能分仓、就近备货和预测式调拨,
~~~     实现”客户需要的商品就在离客户最近的配送中心“。
四、个性推荐
五、” 双11购物节 “ 实时销售额大屏
### --- 汽车

~~~     利用了大数据和物联网技术的无人驾驶汽车,在不远的未来将走入我们的日常生活
### --- 电信

~~~     移动联通根据用户年龄、职业、消费情况,
~~~     分析统计哪种套餐适合哪类人群,对市场人群精准定制。
### --- 生物医学

~~~     大数据可以帮助我们实现流行病预测、智慧医疗、健康管理,
~~~     同时还可以帮助我们解读DNA,了解更多的生命奥秘。
~~~     比如影像大数据支撑下的早期肺癌支撑平台,
~~~     基于大量病例数据样本,制定早期肺癌高危人群预警指标。
五、人工智能
### --- 智慧城市

~~~     大数据有效支撑智慧城市发展,成为城市的”数据大脑“。
~~~     比如,在智慧城市建设上,杭州始终走在全国前列。如覆盖面广的移动支付、
~~~     新颖的在线医疗模式、创新的物流运输模式,都受到较大关注。
~~~     2016年,杭州被《中国新型智慧城市》白皮书评为“中国最智慧的城市”。
~~~     大数据的价值,远远不止于此,大数据对各行各业的渗透,
~~~     大大推动了社会生产和生活,未来必将产生重大而深远的影响。

 
 
 
 
 
 
 
 
 

Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of life.It sinks, and I am ready to depart
                                                                                                                                                   ——W.S.Landor

 

 

posted on   yanqi_vip  阅读(23)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示