大数据之路 读书笔记
阿里的《大数据之路》记录了阿里的大数据系统的产生,演化和设计思路。是大数据进阶的经典书籍。
本篇读书笔记会按照《大数据之路》的目录结构,记录我在阅读这本书的时候,
- 名词解释
- 概述
- 结合电商业务场景的思考
- 摘要
- 以及疑惑
第一章:总述
- 概述:本章由马云的"人类已进入DT时代",所有行业都离不开数据的赋能切入,简单介绍了阿里的,数据采集层,数据计算层,数据服务层,数据应用层的作用和发展过程。
- 数据烟囱:不能与其他相关信息系统之间进行互操作或者说协调工作的数据,类似的名词还有 数据孤岛 碎片化数据等。
- 名词解释:
- 实时数仓:传统数仓的计算频率是小时,日,周或月。但随着交易过程缩短,用户对实时数据产出的实时性要求变高。如双11实时数据大屏。实时数仓的概念应运而生
- 摘要:
- 阿里数据仓库层次划分为:
待更新。。。