摘要: JOIN优化 1.大多数情况下,Hive会对每对Join连接对象启动一个MapReduce任务。 2.多表关联时,如果每个ON子句都使用相同的连接键的话,那么只会产生一个MapReduce Job。 3.Hive总是按照从左到右的顺序执行。Hive会假定最后一张表是最大的表,在对每行记录进行连接操作 阅读全文
posted @ 2017-07-13 11:01 Mr.Ming2 阅读(235) 评论(0) 推荐(0) 编辑
摘要: udf udaf udtf 使用方式 hiverc文件 1、jar包放到安装日录下或者指定目录下 2、${HIVE_HOME}/bin目录下有个.hiverc文件,它是隐藏文件。 3、把初始化语句加载到文件中 然后打开hive时,它会自动执行.hiverc文件。 阅读全文
posted @ 2017-07-13 09:59 Mr.Ming2 阅读(436) 评论(0) 推荐(0) 编辑