摘要: 一、数据导入 1.向表中装载数据(Load) 1.1.语法 hive> load data [local] inpath ‘/opt/module/datas/student.txt’ overwrite | into table student [partition (partcol1=val1, 阅读全文
posted @ 2021-02-24 11:15 cqyyck 阅读(184) 评论(0) 推荐(0) 编辑
摘要: 一、区别 1.建表语句不同。外部表建表被external修饰;内部表没有,默认为内部表。2.存储位置不同。内部表数据存储的位置是hive.metastore.warehouse.dir(默认:/user/hive/warehouse),外部表数据的存储位置由自己制定;3.管理方式不同。内部表数据由h 阅读全文
posted @ 2021-02-24 11:06 cqyyck 阅读(871) 评论(0) 推荐(0) 编辑
摘要: 一、创建表 1.语法 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], …)] [COMMENT table_comment] [PARTITIONED BY 阅读全文
posted @ 2021-02-24 10:22 cqyyck 阅读(1064) 评论(0) 推荐(0) 编辑
摘要: 一、什么是分区表 分区表实际上就是对应一个HDFS文件系统上的独立的文件夹,该文件夹下是该分区所有的数据文件。Hive中的分区就是分目录,把一个大的数据集根据业务需要分割成小的数据集。在查询时通过WHERE子句中的表达式选择查询所需要的指定的分区,这样的查询效率会提高很多。 二、分区表的操作 2.1 阅读全文
posted @ 2021-02-24 09:03 cqyyck 阅读(608) 评论(0) 推荐(0) 编辑