随笔分类 - HIVE学习
Hive文档
摘要:Hive知识体系保姆级教程 一. Hive概览 1.1 hive的简介 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。 其本质是将SQL转换为MapReduce/Spark的任务进行运算,底层由HDFS来提供数据的存储,说白了hive
Hive数据压缩与存储格式
摘要:一、Hive的数据压缩 (一) 数据压缩的优缺点 优点: 减少存储磁盘空间,降低单节点的磁盘IO。 减少网络传输带宽 ,因此可以加快数据在Hadoop集群流动的速度。 缺点: 需要花费额外的时间/CPU做压缩和解压缩计算。 (二)MR支持的压缩编码 压缩格式 工具 算法 文件扩展名 是否
Hive基本使用
摘要:一、Hive基本使用 (一) 基本操作 1. 数据库相关 (1) 创建数据库 create database tm; create database if not exists tm; (2) 切换数据库 use tm; (3) 查看数据库信息 -- 查看数据库信息 desc database tm