摘要: Hive增量更新方案方案一(总结出来业界可行方案):1、Hive原始表提前规划好以时间分区,初始化装载源库记录为base_table(最新数据)2、每个相关表都会有一个timestamp列,对每一行操作做了修改,都会重置这列timestamp为当前时间戳;3、新增数据通过sqoop(支持当天抽取)或 阅读全文
posted @ 2019-10-31 23:02 IT界一个小学生 阅读(2308) 评论(0) 推荐(0) 编辑