zhaohz

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

问题:

有一个表(表名:book,两个字段:id,desc)

id     desc

001    书名: 追风筝的人, ISBN编号: 9787208061644, 作者: 卡勒德.胡赛尼

002    书名: 秘密花园, ISBN编号: 9787550252585, 作者: 乔汉娜·贝斯福

需求:

其中desc字段包含了几个参数信息,需把它拆分开来,一行一个参数,结果如下

001    书名: 追风筝的人

001    ISBN编号: 9787208061644

001     作者: 卡勒德.胡赛尼

002    书名: 秘密花园

002    ISBN编号: 9787550252585

002    作者: 乔汉娜·贝斯福

解决办法:

select id,sp from book a  lateral view explode(split(a.desc,',')) t as sp where 1=1;

id     sp

001  书名: 追风筝的人

001  ISBN编号: 9787208061644

....

其中sp是拆出来的字段的,结果和需求一样。

非常简练,虽然hive有不能insert,update的缺点,但很多sql语法都支持,不失为大数据分析的一个好工具!

 

posted on 2015-07-24 11:28  zzhaoh  阅读(7443)  评论(0编辑  收藏  举报