1.数仓
数据源:业务数据、用户行为数据、爬虫数据
数据源类型:结构化、半结构化、非结构化数据类型。
数仓分层架构
数仓概念:是一个面向主题的、集成的、相对稳定的、反应历史变化的数据集合.
*面向主题:即按照决策者关注的问题和纬度组织数据,而不是按照也饿无功能组织。
*集成性:将多个不同数据源的数据集成到一起。
诞生背景:
解决的问题:
作用:1.将多源异构的数据的数据按照主题重组和存储
2.用于支持管理决策。
特点:
数仓和数据库的区别
数据库:操作型数据库和分析性数据库,分析型数据库和数仓