第七周学习总结
数据仓库基础与Apache Hive入门
数据仓库基本概念:
一个用于存储、分析、报告的数据系统
目的:构建面向分析的集成化数据环境,分析结果为企业提供决策支持
主要特征:
面向主题
集成性
非易失性
时变性
SQL 结构化查询语言
存储数据以及查询更新和管理数据
结构化数据:行数据,由二维表结构来逻辑表达和实现的数据
DDL数据定义语言 DML数据操纵语言
Hive:建立在Hadoop上的开源的数据仓库系统,将存储在Hadoop文件中的结构化、半结构化数据文件映射为一张数据库表
Hive查询语句(HQL)
Hive利用HDFS存储数据,利用MapReduce查询分析数据
映射信息记录,元数据信息
Hive架构组件
用户接口
Hive Metadata元数据
Hive Metastore元数据服务
datagrip连接数据库
数据库与建库、切换库操作
表与建表语句,数据类型、分隔符指定语法
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 零经验选手,Compose 一天开发一款小游戏!
· 一起来玩mcp_server_sqlite,让AI帮你做增删改查!!