摘要: Hive的三种Join方式 hive Hive中就是把Map,Reduce的Join拿过来,通过SQL来表示。 参考链接:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Joins Common/Shuffle/Redu 阅读全文
posted @ 2016-03-26 19:43 Raymoc 阅读(32121) 评论(1) 推荐(5) 编辑
摘要: 如何每日增量加载数据到Hive分区表hadoophiveshellcrontab加载数据数据加载到Hive分区表(两个分区,日期(20160316)和小时(10))中每日加载前一天的日志文件数据到表db_track.track_log1. 数据存储数据日志文件,放入某个目录下,每天日志文件放入同一个目录eg: 20160316 - 目录名称日志文件数据,每个小时生成一个文件,一天总共有二十四... 阅读全文
posted @ 2016-03-26 04:48 Raymoc 阅读(16894) 评论(0) 推荐(1) 编辑