【Hive】解析json字符串
简介:
get_json_object(string json_string, string path)
说明:
- 第一个参数填写json对象变量
- 第二个参数使用$表示json变量标识,然后用 . 或 [] 读取对象或数组;如果输入的json字符串无效,那么返回NULL。
- 每次只能返回一个数据项。
举例:
data 为 test表中的字段,数据结构如下:
data =
{
"store":
{
"fruit":[{"weight":8,"type":"apple"}, {"weight":9,"type":"pear"}],
"bicycle":{"price":19.95,"color":"red"}
},
"email":"amy@only_for_json_udf_test.net",
"owner":"amy"
}
1.get单层值
hive> select get_json_object(data, '$.owner') from test;
结果:amy
2.get多层值.
hive> select get_json_object(data, '$.store.bicycle.price') from test;
结果:19.95
3.get数组值[]
hive> select get_json_object(data, '$.store.fruit[0]') from test;
结果:{"weight":8,"type":"apple"}
explode
explode 就是将hive一行中复杂的array或者map结构拆分成多行。
demo:
select ordernumber, get_json_object(concat('{',deviceId,'}'),'$.deviceInfo.deviceId') from table lateral view explode(split(substr(get_json_object(message,'$.data.YN031.results'),3,length(get_json_object(message,'$.data.YN031.results')) -4),'\\},\\{'))b1 as deviceId where ;
关注公众号 海量干货等你
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Java 中堆内存和栈内存上的数据分布和特点
· 开发中对象命名的一点思考
· .NET Core内存结构体系(Windows环境)底层原理浅谈
· C# 深度学习:对抗生成网络(GAN)训练头像生成模型
· .NET 适配 HarmonyOS 进展
· 本地部署 DeepSeek:小白也能轻松搞定!
· 如何给本地部署的DeepSeek投喂数据,让他更懂你
· 从 Windows Forms 到微服务的经验教训
· 李飞飞的50美金比肩DeepSeek把CEO忽悠瘸了,倒霉的却是程序员
· 超详细,DeepSeek 接入PyCharm实现AI编程!(支持本地部署DeepSeek及官方Dee