数据湖,已成为海量数据存储与分析的重要承载方式

简介: 在云计算和大数据时代,基于数据开展生产、运营、决策成为常态,根据Gartner报道,2019年数据基建方面的采购费用飙升到660亿美元,占据基础架构类软件费用的24%。数据的存储及应用体系是企业生态运转的中枢神经,数据湖已经成为海量数据存储与分析的重要承载方式。

在汹涌而至的信息化浪潮下,大数据技术不断更新迭代,数据管理工具得到飞速发展,相关概念也随之而生。数据湖(Data Lake)概念自2011年被推出后,其概念定位、架构设计和相关技术都得到了飞速发展和众多实践,数据湖也从单一数据存储池概念演进为支撑高效、安全、稳定企业级数据应用的下一代基础数据平台。

 

wp1.png

 

此次发布的《数据湖应用实践白皮书》涵盖了数据湖的定义与架构、数据湖核心组件与方案介绍、数据湖构建方案、应用实践等内容,希望为用户提供新的洞察。

 

wp2.png

 

通过阅读本书,包括开发者、IT运维人员、企业数字化管理者等可以全面了解阿里云基于云原生技术的企业级数据湖解决方案和相关产品,也能明晰传统数据仓库和数据湖的差异。 

 

wp3.png

 

在云计算和大数据时代,基于数据开展生产、运营、决策成为常态,根据Gartner报道,2019年数据基建方面的采购费用飙升到660亿美元,占据基础架构类软件费用的24%。数据的存储及应用体系是企业生态运转的中枢神经,数据湖已经成为海量数据存储与分析的重要承载方式。

 

wp4.png

 

市场调研机构Research and Markets发布的报告显示,2020年,全球数据湖市场的价值为37.4亿美元,预计到2026年将达到176亿美元,在2021年至2026年的预测期间的复合年增长率为29.9%。

 

wp5.png

 

云原生时代的到来,引领数据湖进入了“云湖共生”新的阶段。在此背景下,阿里云推出基于云原生技术的企业级数据湖解决方案,该方案采用了存储计算分离架构,存储层基于阿里云对象存储OSS构建,并与阿里云数据湖分析(Data Lake Analytics 简称 DLA)、数据湖构建(Data Lake Formation简称 DLF)、E-MapReduce(简称EMR)、DataWorks(简称DW)等计算引擎无缝对接,且兼容丰富的开源计算引擎生态。

 

wp6.png

 

十年踪迹十年心,结合先进的数据科学与机器学习技术,数据湖还能为企业提供预测分析,帮助企业构建、优化训练模型等。希望这本白皮书可以为企业和组织的数字化转型实践提供指引,为相关领域的业务决策者与实践者提供面向行业应用场景的重要参考。

本文为阿里云原创内容,未经允许不得转载。

posted @   阿里云云栖号  阅读(336)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
历史上的今天:
2020-03-26 Alibaba Cloud Linux 2 LTS 正式发布,提供更高性能和更多保障!
2020-03-26 Alibaba Cloud Linux 2 LTS 正式发布,提供更高性能和更多保障!
2020-03-26 赋予企业更多可能,云数据库SQL Server 2019版这几大亮点别错过
点击右上角即可分享
微信分享提示