瞌睡中的葡萄虎

博客园 首页 新随笔 联系 订阅 管理

2014年8月13日 #

摘要: order by1、order by会对输入按照指定字段做全局排序,输出结果有序,因此只有一个reducer(多个reducer无法保证全局排序,手工设定reduce数量无效); 只有一个reducer会导致当输入规模较大时,需要较长的计算时间,速度很非常慢;在数据量大的情况下慎用order by... 阅读全文
posted @ 2014-08-13 18:11 瞌睡中的葡萄虎 阅读(2242) 评论(0) 推荐(0) 编辑

摘要: 本案例使用的数据均来源于Oracle自带的emp和dept表创建表语法:CREATE [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.]table_name [(col_name data_type [COMMENT col_comment], ...)] [... 阅读全文
posted @ 2014-08-13 16:17 瞌睡中的葡萄虎 阅读(1042) 评论(0) 推荐(0) 编辑