随笔 - 126  文章 - 0  评论 - 5  阅读 - 94759
12 2019 档案
Python~编程练习
摘要:aaa 阅读全文
posted @ 2019-12-28 11:17 大鹏的鸿鹄之志 阅读(111) 评论(0) 推荐(0) 编辑
实时计算
摘要:canal的作用? 阅读全文
posted @ 2019-12-20 00:46 大鹏的鸿鹄之志 阅读(130) 评论(0) 推荐(0) 编辑
数据仓库建设步骤
摘要:数据仓库是面向主题的、集成的、不可更新的、随时间的变化而不断变化的,这些特点决定了数据仓库的系统设计不能采用同开发传统的OLTP数据库一样的设计方法。 数据仓库系统的原始需求不明确,且不断变化与增加,开发者最初不能确切了解到用户的明确而详细的需求,用户所能提供的无非是需求的大的方向以及部分需求, 更 阅读全文
posted @ 2019-12-12 23:50 大鹏的鸿鹄之志 阅读(2237) 评论(0) 推荐(0) 编辑
数据仓库~视屏学习~尚硅谷
摘要:恢复内容开始 数据仓库为什么要分层? 层次越多说明越复杂 1,把复杂问题简单化, 将一个复杂的任务分解成多个步骤来完成,每一层处理单一的步骤,比较简单,方便定位问题 2,减少重复开发 规范数据分层,通过中间层数据,能减少极大的重复计算,增加一次计算结果的复用性。 3,隔离原始数据 不论是数据的异常还 阅读全文
posted @ 2019-12-09 23:18 大鹏的鸿鹄之志 阅读(315) 评论(0) 推荐(0) 编辑
数据倾斜的原因和解决方案
摘要:MapReduce简介MapReduce是面向大数据并行处理的计算模型、框架和平台,它隐含了以下三层含义: 1)MapReduce是一个基于集群的高性能并行计算平台(Cluster Infrastructure)。它允许用市场上普通的商用服务器构成一个包含数十、数百至数千个节点的分布和并行计算集群。 阅读全文
posted @ 2019-12-06 23:43 大鹏的鸿鹄之志 阅读(11167) 评论(0) 推荐(1) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示