HIVE 走近大数据之Hive入门---慕课网---个人笔记总结
HIVE学习笔记
1、创建表
create table emp(
id int,
name string,
gender string
)
2、创建表写入想要存放的位置
create table emp(
id int,
name string,
gender string
)
location '/usr/data/hive/emp'
3、创建表指定分隔符,默认是制表符('\t')
create table emp(
id int,
name string,
gender string
)
//用逗号作为分隔符(',')
row format delimited fields terminated by ','
4、快速复制表
create table emp_copy
as
select * from emp;
create table emp_copy
//用逗号作为分隔符(',')
row format delimited fields terminated by ','
as
select * from emp;
5、增加表列
alter table emp add columns(class string)
6、删除表 如果开启了回收机制,删除后会移动到里面,然后定期删除
drop table emp
7、创建分区表
1)内部表:Partition对应于数据库的partition列的密集索引,在hive中表中的一个partition对应于表下的一个目录,所有的partition的数据都存储在对应的目录中;
explain可以查询执行效率是否提升,执行过程从下往上,从右往左
insert into table emp_table partition(gender = 'M') select id, name from emp where gender = 'M';
insert into table emp_table partition(gender = 'F') select id, name from emp where gender = 'F';
2)外部表(External Table):指向已经在HDFS中存在的数据,可以创建partition,外部表只有一个过程,加载数据和创建表时同时完成,并不会移动到数据库目录中,
只是与外部数据建立一个链接。当删除一个外部表时,仅删除该链接
external table emp(
id int,
name string,
gender string
)
//用逗号作为分隔符(',')
row format delimited fields terminated by ','
//指定数据存放位置
location '/usr/data/hive/emp'
3)不同点:外部表和内部表在元数据组织上是相同的,而实际数据的存储则有较大的差异
4)桶表(Bucket Table)
桶表是对数据进行哈希取值,然后放到不同文件中存储
create table emp(
id int,
name string,
gender string
)
//根据name字段进行放置5个桶
clustered by(name) into 5 buckets;
5)视图(View)
视图是一种虚表,是一个逻辑概念;可以跨越多张表,视图简历在已有的表的基础上,视图赖以建立的这些表称谓基表,
视图可以简化复杂的查询
//emp、dept两个表为基表,由视图展示出来---只能做展示
create view empInfo
as
select e.id, e.name, e.gender, dept.age
from emp e, dept d
where e.id = dept.id
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南