摘要: 转自http://www.alidata.org/archives/581Hive 的官方文档中对查询语言有了很详细的描述,请参考:http://wiki.apache.org/hadoop/Hive/LanguageManual ,本文的内容大部分翻译自该页面,期间加入了一些在使用过程中需要注意到的事项。Create TableCREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...)] [COMMENT table_comment] [PARTITIO 阅读全文
posted @ 2013-12-26 18:42 ling-note 阅读(235) 评论(0) 推荐(0) 编辑
摘要: 转自http://www.alidata.org/archives/622使用Hive可以高效而又快速地编写复杂的MapReduce查询逻辑。但是某些情况下,因为不熟悉数据特性,或没有遵循Hive的优化约定,Hive计算任务会变得非常低效,甚至无法得到结果。一个”好”的Hive程序仍然需要对Hive运行机制有深入的了解。有一些大家比较熟悉的优化约定包括:Join中需要将大表写在靠右的位置;尽量使用UDF而不是transfrom……诸如此类。下面讨论5个性能和逻辑相关的问题,帮助你写出更好的Hive程序。全排序Hive的排序关键字是SORT BY,它有意区别于传统数据库的ORDER BY也是为了 阅读全文
posted @ 2013-12-26 18:33 ling-note 阅读(455) 评论(0) 推荐(0) 编辑