摘要: 常用:ORC & Parquet 性能对比: hbase底层用sequenceFile 一、从text格式 到 orc => 利用中间表方法(从textfile到orc):https://blog.csdn.net/happyrocking/article/details/90178439 CREA 阅读全文
posted @ 2020-11-24 17:09 PEAR2020 阅读(905) 评论(0) 推荐(0) 编辑
摘要: 一、hive有主键吗?有索引吗 hive中没有主外键,但是有索引!!!关系型才有主外键!!! 二、hive的“主键” 1. uuid 缺点:uuid太长了,随机的不利于重跑,如果别的维度表要用到此维度表主键做外键,只要重跑了会变,那么作为外键值又得改了2. row_number() 缺点:重复3. 阅读全文
posted @ 2020-11-24 16:35 PEAR2020 阅读(5992) 评论(0) 推荐(1) 编辑
摘要: 基于时间戳CDC 基于触发器的CDC 基于快照的CDC 基于日志的CDC 基本用时间戳CDC,日志CDC! 分为侵入式和非侵入式。侵入式:对源数据库有sql操作,有性能影响(前三种都是) 1.基于时间戳CDC 两列时间,分别记录create_time和modify_time,可以识别变动数据 缺点: 阅读全文
posted @ 2020-11-24 16:34 PEAR2020 阅读(1253) 评论(2) 推荐(0) 编辑
摘要: 分类: 数据库级触发器 表级触发器 行级触发器 增删改触发器(根据触发时机) 场景1:解除外键约束 一般来说,插表先插主表,删表先删从表(见:https://www.cnblogs.com/sabertobih/p/13966709.html) 外键约束的创建限制: >>> 如何用触发器实现:插表和 阅读全文
posted @ 2020-11-24 16:31 PEAR2020 阅读(121) 评论(0) 推荐(0) 编辑