2021年4月24日

文件系统、Hive

摘要: 实时数据 →文件系统(Linux文件系统、HDFS、国!用的kudu等) 导入到hive,Load。 →Hive (转成相应的hive表,导入后可直接使用HiveSQL查询) hive的内容分两部分:元数据、数据。 其中数据是存在HDFS中,元数据存在mysql中。 Hive数据仓库 Hive/my 阅读全文

posted @ 2021-04-24 22:55 静静的白桦林_andy 阅读(67) 评论(0) 推荐(0) 编辑

数据仓库、数据库、数仓结构(模型)、十大主题、数据平台

摘要: 1.数据仓库是从底层数据收集、ETL、数据存储、数据整理存储等的一套流程。 2.数据库我理解是数据仓库的一部分,我理解它是数据集市的组成部分,多个数据库组成一个数据库,多为关系型数据库。 3.因为数据仓库是个大工程,在建之前要想好按照什么架构来组织数据,这就分为了星型结构、雪花结构、星座模型等。 4 阅读全文

posted @ 2021-04-24 20:22 静静的白桦林_andy 阅读(5341) 评论(0) 推荐(0) 编辑

导航