第七周学习总结

数据仓库基础与Apache Hive入门

数据仓库基本概念:

一个用于存储、分析、报告的数据系统

目的:构建面向分析的集成化数据环境,分析结果为企业提供决策支持

主要特征:

面向主题

集成性

非易失性

时变性

 

SQL 结构化查询语言

存储数据以及查询更新和管理数据

结构化数据:行数据,由二维表结构来逻辑表达和实现的数据

DDL数据定义语言   DML数据操纵语言

 

Hive:建立在Hadoop上的开源的数据仓库系统,将存储在Hadoop文件中的结构化、半结构化数据文件映射为一张数据库表

Hive查询语句(HQL)

 

Hive利用HDFS存储数据,利用MapReduce查询分析数据

映射信息记录,元数据信息

 

Hive架构组件

用户接口

Hive Metadata元数据

Hive Metastore元数据服务

 

datagrip连接数据库

数据库与建库、切换库操作

 

 

 

表与建表语句,数据类型、分隔符指定语法

 

 

 

 

posted @   代不动码  阅读(7)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 零经验选手,Compose 一天开发一款小游戏!
· 一起来玩mcp_server_sqlite,让AI帮你做增删改查!!
点击右上角即可分享
微信分享提示