数据仓库建设步骤
摘要:数据仓库是面向主题的、集成的、不可更新的、随时间的变化而不断变化的,这些特点决定了数据仓库的系统设计不能采用同开发传统的OLTP数据库一样的设计方法。 数据仓库系统的原始需求不明确,且不断变化与增加,开发者最初不能确切了解到用户的明确而详细的需求,用户所能提供的无非是需求的大的方向以及部分需求, 更
阅读全文
posted @
2019-12-12 23:50
大鹏的鸿鹄之志
阅读(2237)
推荐(0) 编辑
数据仓库~视屏学习~尚硅谷
摘要:恢复内容开始 数据仓库为什么要分层? 层次越多说明越复杂 1,把复杂问题简单化, 将一个复杂的任务分解成多个步骤来完成,每一层处理单一的步骤,比较简单,方便定位问题 2,减少重复开发 规范数据分层,通过中间层数据,能减少极大的重复计算,增加一次计算结果的复用性。 3,隔离原始数据 不论是数据的异常还
阅读全文
posted @
2019-12-09 23:18
大鹏的鸿鹄之志
阅读(315)
推荐(0) 编辑
数据倾斜的原因和解决方案
摘要:MapReduce简介MapReduce是面向大数据并行处理的计算模型、框架和平台,它隐含了以下三层含义: 1)MapReduce是一个基于集群的高性能并行计算平台(Cluster Infrastructure)。它允许用市场上普通的商用服务器构成一个包含数十、数百至数千个节点的分布和并行计算集群。
阅读全文
posted @
2019-12-06 23:43
大鹏的鸿鹄之志
阅读(11167)
推荐(1) 编辑