实用的jsonpath模块
1.简介
jsonpath一般用来解析多层嵌套的json数据,语法规则类似于xpath
2.下面以官网上的一段json数据做为demo我们来做解析操作,读者可在http://jsonpath.com/上面进行解析验证操作
{
"store": {
"book": [
{ "category": "reference",
"author": "Nigel Rees",
"title": "Sayings of the Century",
"price": 8.95
},
{ "category": "fiction",
"author": "Evelyn Waugh",
"title": "Sword of Honour",
"price": 12.99
},
{ "category": "fiction",
"author": "Herman Melville",
"title": "Moby Dick",
"isbn": "0-553-21311-3",
"price": 8.99
},
{ "category": "fiction",
"author": "J. R. R. Tolkien",
"title": "The Lord of the Rings",
"isbn": "0-395-19395-8",
"price": 22.99
}
],
"bicycle": {
"color": "red",
"price": 19.95
}
}
}
例如,我们要提取该json字符串中的所有price字段的信息,可以用以下方式:
表达式:$..price
返回值:[8.95, 12.99, 8.99, 22.99, 19.95]
是不是一行代码搞定,非常简单快捷,下面请看jsonpath的语法规则
3. 操作符
符号 |
描述 |
$ |
查询的根节点对象,用于表示一个json数据,可以是数组或对象 |
@ |
过滤器断言(filter predicate)处理的当前节点对象,类似于java中的this字段 |
* |
通配符,可以表示一个名字或数字 |
.. |
可以理解为递归搜索,Deep scan. Available anywhere a name is required. |
.<name> |
表示一个子节点 |
[‘<name>’ (, ‘<name>’)] |
表示一个或多个子节点 |
[<number> (, <number>)] |
表示一个或多个数组下标 |
[start:end] |
数组片段,区间为[start,end),不包含end |
[?(<expression>)] |
过滤器表达式,表达式结果必须是boolean |
4. 函数
可以在JsonPath表达式执行后进行调用,其输入值为表达式的结果。
名称 |
描述 |
输出 |
min() |
获取数值类型数组的最小值 |
Double |
max() |
获取数值类型数组的最大值 |
Double |
avg() |
获取数值类型数组的平均值 |
Double |
stddev() |
获取数值类型数组的标准差 |
Double |
length() |
获取数值类型数组的长度 |
Integer |
5. 过滤器
过滤器是用于过滤数组的逻辑表达式,一个通常的表达式形如:[?(@.age > 18)],可以通过逻辑表达式&&或||组合多个过滤器表达式,例如[?(@.price < 10 && @.category == ‘fiction’)],字符串必须用单引号或双引号包围,例如[?(@.color == ‘blue’)] or [?(@.color == “blue”)]。
操作符 |
描述 |
== |
等于符号,但数字1不等于字符1(note that 1 is not equal to ‘1’) |
!= |
不等于符号 |
< |
小于符号 |
<= |
小于等于符号 |
> |
大于符号 |
>= |
大于等于符号 |
=~ |
判断是否符合正则表达式,例如[?(@.name =~ /foo.*?/i)] |
in |
所属符号,例如[?(@.size in [‘S’, ‘M’])] |
nin |
排除符号 |
size |
size of left (array or string) should match right |
empty |
判空符号 |
6.举例:
获取book节点下的所有author
表达式:$.store.book[*].author 或者 $..author
获取store下的所有price
表达式:$.store..price
获取book节点下前两本书
表达式:$..book[0,1] 或者切片的方式 $..book[:2]
获取book节点下的最后的两本书
表达式:$..book[-2:]
获取所有具有isbn属性的书
获取price小于10 的书
表达式:$..book[?(@.price<10)]
获取book节点下书的总数量
表达式:$..book.length()
python中应用举例:
注:这里的obj代指json对象