摘要: 本人认为hive是很好的工具,目前支持mr,tez,spark执行引擎,有些大公司原来封装的sparksql,开发py脚本,但是目前hive支持spark引擎(不是很稳定,建议Tez先),所以离线还是用hive比较好。 先将工作中总结,以及学习其他人的hive优化总结如下: 一. 表连接优化 这是比 阅读全文
posted @ 2018-02-28 17:46 ¥王大胖¥ 阅读(700) 评论(0) 推荐(1) 编辑