读取json文件中多个json对象
一、读取json文件中多个json对象
文件的格式如下图:
拿到文件首先尝试with open读取,马上报错。原因是一个文件中有多个json,这种情况使用json.load()就无法读取了。
我的文件格式是[{{}},{{}},{{}}]这种格式。从上图也能看出,如果是每行一个json的话还是可以使用readline然后load来处理。但可惜我的json文件是格式化的。
所以只能想别的办法,网上搜了一下给的解决方案是一个decdoe什么的模块,看了半天没看出个所以然来,而且资料很少,就没有尝试。
想过将数据文件保存成csv然后用pandas读取,可惜转成csv后dict里的键值关系全乱套了。
苦思冥想之后突然想到既然pandas能读取csv能不能读取json呢,然后尝试一下,大赞。
import pandas as pd
#读取文件
frame = pd.read_json(r'C:\Users\zhaobw\Desktop\news.txt')
#设置显示所有列
pd.set_option('display.max_columns', None)
# print(frame)
#遍历dataframe中的所有行
for index, row in frame.iterrows():
print(row["_id"], row["_source"])
#解析行里的dict内容
mydict = row["_source"]
for key in mydict:
print(key['_ch'])
---------------------------------------------------------
恐惧是因为努力的还不够,加油 ~~---------------------------------------------