随笔分类 -  数据仓库

数据仓库-数据集市
摘要:数据仓库-数据集市 概念 数据集市是数据仓库的一种简单形式,通常由组织内的业务部门自己建立和控制。一个数据集市面向单一主题域,如销售、财务、市场等。数据集市的数据源可以是操作型系统(独立数据集市),也可以是企业级数据仓库(从属数据集市)。 与数仓区别 范围 数仓:企业级 数据集市:部门级或业务线 主 阅读全文

posted @ 2020-12-27 20:04 嘣嘣嚓 阅读(551) 评论(0) 推荐(0) 编辑

数据仓库-实施步骤
摘要:数据仓库-实施步骤 定义范围 项目范围定义了一个数据仓库项目的边界。典型的范围定义是组织、地区、应用、业务功能的联合表示。 定义范围时通常需要权衡考虑资源(人员、系统、预算等)、进度(项目的时间和里程碑要求)、功能(数据仓库承诺达到的能力)三方面的因素。 定义好清晰明确的范围,并得到所有项目干系人的 阅读全文

posted @ 2020-12-27 20:00 嘣嘣嚓 阅读(610) 评论(0) 推荐(0) 编辑

数据仓库-数据清洗
摘要:数据仓库-数据清洗 定义 ETL 抽取(Extract)、转换(Transform)、加载(Load) ETL的核心价值在"T"所代表的转换部分 数据清洗是对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性 为什么要进行数据清洗 数据仓库中的数据是面向某一主题数据 阅读全文

posted @ 2020-12-27 19:40 嘣嘣嚓 阅读(2292) 评论(0) 推荐(0) 编辑

数据仓库-维度模型(模型类型、建模过程)
摘要:数据仓库-维度模型 描述 Dimensional Modeling,简称DM,是一套技术和概念的集合,用于数据仓库设计 核心概念 事实 表示对业务数据的度量 通常是数字类型的,可以进行聚合和计算 维度 对观察数据的角度 一组层次关系或描述信息,用来定义事实 举例:销售金额是一个事实,而销售时间、销售 阅读全文

posted @ 2020-12-27 17:40 嘣嘣嚓 阅读(1966) 评论(0) 推荐(0) 编辑

数据仓库-维度
摘要:各维度类型 渐变维 描述 渐变维(SCD. Slowly Change Dimension),是一种在多维数据仓库中实现维度历史的技术 类型 SCD1 通过更新维度记录直接覆盖已存在的值,它不维护记录的历史 一般用于修改错误的数据 SCD2 在源数据发生变化时,给维度记录建立一个新的版本记录,从而维 阅读全文

posted @ 2020-12-27 17:20 嘣嘣嚓 阅读(550) 评论(0) 推荐(0) 编辑

数据仓库-特征
摘要:一句话描述 面向主题的、集成的、随时间变化的、非易失的数据集合,用于支持管理者的决策过程。 特性 1.面向主题 传统的操作性系统是围绕组织的功能性应用进行组织的,而数据仓库是面向主题的。主题是一个抽象概念,简单地说就是与业务相关的数据的类别,每一个主题基本对应一个宏观的分析领域。 主题域是对某个主题 阅读全文

posted @ 2020-11-23 21:37 嘣嘣嚓 阅读(454) 评论(0) 推荐(0) 编辑

数据仓库-数据仓库的简介(由来、与关系数据库的区别、数据仓库模型)
摘要:数据仓库的基本概念 数据仓库泛化、合并多维空间的数据。构造数据仓库涉及数据清理、数据集成和数据变换,可以看做数据挖掘的一个重要预处理步骤。此外,数据仓库提供联机分析处理(OLAP)工具,用于各种粒度的多维数据的交互分析,有利于有效的数据泛化和数据挖掘。 1.什么是数据仓库 数据仓库的建立为工商企业主 阅读全文

posted @ 2019-05-06 22:41 嘣嘣嚓 阅读(851) 评论(0) 推荐(0) 编辑

导航

< 2025年2月 >
26 27 28 29 30 31 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 1
2 3 4 5 6 7 8
点击右上角即可分享
微信分享提示