随笔档案「2013年12月26日」：Hive QL ... - ling-note

2013年12月26日

摘要：转自http://www.alidata.org/archives/581Hive 的官方文档中对查询语言有了很详细的描述，请参考：http://wiki.apache.org/hadoop/Hive/LanguageManual ，本文的内容大部分翻译自该页面，期间加入了一些在使用过程中需要注意到的事项。Create TableCREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...)] [COMMENT table_comment] [PARTITIO 阅读全文

posted @ 2013-12-26 18:42 ling-note 阅读(248) 评论(0) 推荐(0)

写好Hive 程序的五个提示

摘要：转自http://www.alidata.org/archives/622使用Hive可以高效而又快速地编写复杂的MapReduce查询逻辑。但是某些情况下，因为不熟悉数据特性，或没有遵循Hive的优化约定，Hive计算任务会变得非常低效，甚至无法得到结果。一个”好”的Hive程序仍然需要对Hive运行机制有深入的了解。有一些大家比较熟悉的优化约定包括：Join中需要将大表写在靠右的位置；尽量使用UDF而不是transfrom……诸如此类。下面讨论5个性能和逻辑相关的问题，帮助你写出更好的Hive程序。全排序Hive的排序关键字是SORT BY，它有意区别于传统数据库的ORDER BY也是为了阅读全文

posted @ 2013-12-26 18:33 ling-note 阅读(481) 评论(0) 推荐(0)

ling的note

公告