从数据仓库到数据湖—浅谈数据架构演进
文章目录
数据库–>数据仓库–>数据湖的架构演变,反映的是数据需求变更
了解最近技术发展动态,记录一下相关知识点,跟上技术发展的步伐。
- 上半年参加系统分析师考试,论文部分有个论题 是关于AIOPS的。我在想实际工作中,我们连DEVOPS流程还没做好呢,AIOPS已经在一些大公司实施了。
- 刚刚过去的周六,参加系统架构设计师考试,论文部分又出现了数据湖的应用实践,数据湖与数据仓库的差异性有哪些?新的概念不断的冒出,基础知识,历史渊源做一个整理记录。
1、数据仓库是什么
“A data warehouseis a subject-oriented, integrated, time-variant, and nonvolatile collection ofdata in support of management’s decision-making process.”
—W. H. Inmon
数据仓库和数据库的区别就是OLAP和OLTP的区别。
数据库支持是OLTP,数据仓库支持的是OLAP
数据仓库一般基于数据库实现,数据仓库可以是基于关系数据库实现的称为ROLAP,数据仓库也可以是基于多维数据结构实现的为MOLAP
2、数据建模
数据仓库最为核心的内容分类两部分:
- 基于关系数据库的多维建模(RDBMS-based dimensional modeling)
建模方法论-结合RDBMS的范式理论,建模过程中涉及的几个概念:
雪花模型
星型模型
全量数据、增量数据
- 解决数据存储的拉链设计模式
- 基于数据立方体的OLAP查询(cube-based OLAP)
3、传统数据仓库及代表产品
4、大数据架构下的数据仓库
lamda架构
kappa架构
5、数据湖是什么?
6、数据湖、数据仓库有何区别
7、数据湖应用场景有哪些
8、参考材料
从数据仓库到数据湖——浅谈数据架构演进
martin-flower-about-Datalake
数据仓库的架构与设计
etl-开发过程介绍
posted on 2019-11-12 10:16 coding-now 阅读(150) 评论(0) 编辑 收藏 举报
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步