随笔分类 - 大数据
摘要:https://mp.weixin.qq.com/s/3SdcPYLm3qkUuQplQeOTDA 在大数据处理和人工智能时代,数据工厂(Data Factory)无疑是一个非常重要的大数据处理平台。市面上也有成熟的相关产品,比如Azure Data Factory,不仅功能强大,而且依托微软的云计
阅读全文
摘要:阅读目录 前言 创建数据仓库 ETL:抽取、转换、加载 OLAP/BI工具 数据立方体(Data Cube) OLAP的架构模式 小结 回到顶部 前言 上一篇重点讲解了数据仓库建模,它是数据仓库开发中最核心的部分。然而完整的数据仓库系统还会涉及其他一些组件的开发,其中最主要的是ETL工程,在线分析处
阅读全文
摘要:阅读目录 前言 维度建模的基本概念 维度建模的三种模式 实例:零售公司销售主题的维度建模 更多可能的事实属性 经典星座模型 缓慢变化维度问题 数据仓库建模体系之规范化数据仓库 数据仓库建模体系之维度建模数据仓库 数据仓库建模体系之独立数据集市 三种数据仓库建模体系对比 小结 回到顶部 前言 数据仓库
阅读全文
摘要:阅读目录 前言 数据库的"分家" 操作型数据库 VS 分析型数据库 数据仓库(data warehouse)定义 数据仓库组件 数据集市(data mart) 数据仓库开发流程 小结 回到顶部 前言 阅读本文前,请先回答下面两个问题: 1. 数据库和数据仓库有什么区别? 2. 某大公司Hadoop
阅读全文
摘要:Splunk是什么?从功能上讲,Splunk是一款功能完善、强大的机器数据(MachineData)分析平台,涵盖机器数据收集、索引、搜索、监控、分析、可视化、告警等功能。之所以说是“平台”而不仅仅是工具,是因为Splunk经过多年的发展,功能十分强大且灵活,允许用户在其上自定义应用(App),目前
阅读全文