关闭页面特效

前言

不以完美记录做为目标。以记录自己学习过程为主线，进行记录，记录通过实践，来了解原理，并把这个实践过程分享给后来需要学习的同学。

本节：了解hive catalog与hadoop catalog的区别，进行认识

1. 建立 hive catalog，建表

创建hive_catalog与表

CREATE CATALOG hive_catalog4 WITH (
  'type'='iceberg',
  'catalog-type'='hive',
  'uri'='thrift://hadoop101:9083',
  'clients'='5',
  'property-version'='1',
  'warehouse'='hdfs:user/hive/warehouse/hive_catalog4'
);
在hive_catalog下创建数据库
use catalog hive_catalog4;
CREATE TABLE `hive_catalog4`.`default`.`sample` ( id BIGINT COMMENT 'unique id', data STRING );

2. 查看hdfs

[root@hadoop101 ~]# hadoop fs -ls -R /user/hive/warehouse/sample/
drwxr-xr-x   - root supergroup          0 2022-01-18 15:23 /user/hive/warehouse/sample/metadata
-rw-r--r--   2 root supergroup       1150 2022-01-18 15:23 /user/hive/warehouse/sample/metadata/00000-a426dad1-4ec5-43d0-a7c8-f82601c3d055.metadata.json

3. 写入数据到iceberg

Flink SQL> insert into `hive_catalog4`.`default`.`sample` values(1,'first line');
[INFO] Submitting SQL update statement to the cluster...
[INFO] Table update statement has been successfully submitted to the cluster:
Job ID: 57b4c09b1be6206a2d7a56410444521e

4. 检查写入后,表目录结构的变化

}[root@hadoop101 ~]# hadoop fs -ls -R /user/hive/warehouse/sample/
drwxr-xr-x   - root supergroup          0 2022-01-18 15:36 /user/hive/warehouse/sample/data
-rw-r--r--   2 root supergroup        721 2022-01-18 15:36 /user/hive/warehouse/sample/data/00001-0-c2e5157c-14da-4e49-8ef1-11d0d9266e3c-00001.parquet
drwxr-xr-x   - root supergroup          0 2022-01-18 15:36 /user/hive/warehouse/sample/metadata
-rw-r--r--   2 root supergroup       1150 2022-01-18 15:23 /user/hive/warehouse/sample/metadata/00000-a426dad1-4ec5-43d0-a7c8-f82601c3d055.metadata.json
-rw-r--r--   2 root supergroup       2180 2022-01-18 15:36 /user/hive/warehouse/sample/metadata/00001-8374a8ad-ccee-4eda-9944-e3ac8c7ea085.metadata.json
-rw-r--r--   2 root supergroup       5785 2022-01-18 15:36 /user/hive/warehouse/sample/metadata/a3ba6a34-0074-421b-a3fe-8e31e2db1546-m0.avro
-rw-r--r--   2 root supergroup       3758 2022-01-18 15:36 /user/hive/warehouse/sample/metadata/snap-7791812362316409514-1-a3ba6a34-0074-421b-a3fe-8e31e2db1546.avro

发现：数据写入了data目录，metadata发生变化，老的metadata不变，变化以增量文件的形式进行记录。hive catalog还是做了所有hadoop catalog的事情。

总结

数据写入了data目录，metadata发生变化，老的metadata不变，变化以增量文件的形式进行记录。hive catalog还是做了所有hadoop catalog的事情。

posted on 2022-04-16 14:14 大码王阅读(298) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 实践数据湖iceberg 第二课 iceberg基于hadoop的底层数据格式

· 实践数据湖iceberg 第三课在sqlclient中，以sql方式从kafka读数据到iceberg

· 使用-数据湖Iceberg和现有hive数仓打通并使用

· Hive教程

· 1_hive入门

公告

青青陵上柏，磊磊涧l0(

运行时长：2258天0小时56分4秒

您的浏览器不兼容canvas

昵称：大码王
园龄： 5年8个月
粉丝： 233
关注： 30

+加关注

2025年3月

日

一

二

三

四

五

六

随笔分类 (719)

clickhouse(4)

flink源码分析(2)

Groovy(1)

Java(34)

Linux(3)

office(10)

OpenStack入门(1)

Phoenix+hbase(11)

photoshop(10)

python之绘图(7)

python之爬虫(15)

python之入门到实战(26)

shell大全(1)

SparkCore(14)

sparkGraphx(2)

sparksql(8)

sparkstreaming(17)

spark源码分析(11)

博客园美化(6)

操作系统(1)

随笔档案 (693)

2024年5月(4)

2024年3月(3)

2023年9月(1)

2023年4月(2)

2023年3月(4)

2023年2月(1)

2022年12月(1)

2022年11月(1)

2022年9月(2)

2022年8月(17)

2022年7月(5)

2022年5月(3)

2022年4月(18)

2021年9月(1)

2021年6月(9)

2021年5月(19)

2021年2月(1)

2021年1月(17)

2020年12月(7)

2020年11月(19)

文章分类 (35)

airflow(4)

azkban(1)

canal(1)

Cassandra(1)

datax(1)

druid(1)

Elasticsearch(8)

java(11)

mongodb(2)

redis(3)

scala(2)

文章档案 (40)

2024年4月(2)

2023年5月(2)

2023年4月(1)

2023年1月(1)

2020年6月(9)

2020年5月(25)

前言

1. 建立 hive catalog，建表

2. 查看hdfs

3. 写入数据到iceberg

4. 检查写入后,表目录结构的变化

总结

公告

搜索

常用链接

最新随笔

积分与排名

随笔分类 (719)

随笔档案 (693)

文章分类 (35)

文章档案 (40)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

喜欢请打赏