摘要: ORDER BY是全局排序,但在数据量大的情况下,花费时间会很长 SORT BY是将reduce的单个输出进行排序,不能保证全局有序 DISTRIBUTE BY可以按指定字段将数据划分到不同的reduce中 当DISTRIBUTE BY的字段和SORT BY的字段相同时,可以用CLUSTER BY来 阅读全文
posted @ 2019-08-25 21:33 北漂屌丝 阅读(147) 评论(0) 推荐(0) 编辑
摘要: 使用LIKE运算选择类似的值,选择条件可以包含字符或数字:% 代表零个或多个字符(任意个字符)。_ 代表一个字符 RLIKE子句是Hive中这个功能的一个扩展,可以通过Java的正则表达式这个更强大的语言来指定匹配条件 查找以2开头薪水的员工信息:hive (default)> select * f 阅读全文
posted @ 2019-08-25 20:39 北漂屌丝 阅读(7174) 评论(0) 推荐(0) 编辑