数据仓库迁移——MPP架构和Hadoop的区别
摘要:最近在做一个数据仓库迁移的项目,目前在前期阶段,所以学习一下MPP架构的概念。 目前项目组想要替换掉的是Teradata所提供的一个MPP架构的数据仓库,所以做数据仓库迁移。迁移目标为南大通用所提供的GBASE。 对于MPP架构网上的资料较少,开源的有Greenplum这几天在看。由于之前做大数据的
阅读全文
posted @
2021-06-25 09:50
桌子哥
阅读(1539)
推荐(0) 编辑
数据库、数据仓库、大数据平台、数据中台、数据湖对比分析
摘要:层出不穷的新技术、新概念、新应用往往会对初学者造成很大的困扰,有时候很难理清楚它们之间的区别与联系。本文将以数据研发相关领域为例,对比分析我们工作中高频出现的几个名词,主要包括以下几个方面: 数据 什么是大数据 数据分析与数据挖掘的区别是什么 数据库 什么是数据库 数据库中的分布式事务理论 数据仓库
阅读全文
posted @
2021-06-24 16:42
桌子哥
阅读(3307)
推荐(1) 编辑
SQL的分组与透视
摘要:数据分组是对相同类别的数据进行汇总,而数据透视表是通过对行或列的不同组合对数据进行汇总,所使用的汇总方法有求和、计数、平均值、标准差等,本文使用SQL对数据进行数据分组和数据透视,下面一起来学习。 1)普通分组 普通的数据分组这里使用的GROUP BY函数,同时使用COUNT函数进行计数。 #数据分
阅读全文
posted @
2021-06-05 21:14
桌子哥
阅读(575)
推荐(0) 编辑