python实现比对两个json串的方法
记录瞬间
前段时间为了解决一些实际问题,引出了要对json字符串进行比对的需求。
觉得有意义,作以简单记录。
# 比对数据 def compare_data(set_key, src_data, dst_data, noise_data, num): if isinstance(src_data, dict) and isinstance(dst_data, dict): """若为dict格式""" for key in dst_data: if key not in src_data: print("src不存在这个key") noise_data[key] = "src不存在这个key" for key in src_data: if key in dst_data: if src_data[key] != dst_data[key] and num == 1: noise_data[key] = "容忍不等" if src_data[key] != dst_data[key] and num == 2: noise_data[key] = {} noise_data[key]["primary"] = src_data[key] noise_data[key]["candidate"] = dst_data[key] """递归""" compare_data(key, src_data[key], dst_data[key], noise_data, num) else: noise_data[key] = ["dst不存在这个key"] elif isinstance(src_data, list) and isinstance(dst_data, list): """若为list格式""" if len(src_data) != len(dst_data) and len(set_key) != 0: print("list len: '{}' != '{}'".format(len(src_data), len(dst_data))) noise_data[set_key]["primary"] = str(src_data) noise_data[set_key]["candidate"] = str(dst_data) return if len(src_data) == len(dst_data) and len(src_data) > 1: for index in range(len(src_data)): for src_list, dst_list in zip(sorted(src_data[index]), sorted(dst_data[index])): """递归""" compare_data("", src_list, dst_list, noise_data, num) else: for src_list, dst_list in zip(sorted(src_data), sorted(dst_data)): """递归""" compare_data("", src_list, dst_list, noise_data, num) else: if str(src_data) != str(dst_data): print("src_data", src_data, "dst_data", dst_data) return noise_data
代码实现了出入的src_data、dst_data两个字符串,noise_data作为记录两个字符串的差异进行返回。
set_key是对json串中存在key值对应的list列表时,比对了列表长度不等,我们认为不需要在对列表中的具体元素进行对比。
num区分第一次对比和第二次对比时需要记录的选项。
# 分析获取的数据,并清空存储 def analyse_data(): noise_data1 = {} mark_result = compare_data("", response["primary"], response["secondary"], noise_data1, 1) noise_data2 = {} comp_result = compare_data("", response["primary"], response["candidate"], noise_data2, 2) td1 = "<tr><td style=\"background-color: #fcf8e3\">" td2 = "</td><td style=\"width: 45%;padding: 8px;background-color: " \ "#dff0d8;line-height: 1.42857143;vertical-align: left;\"><pre style=\"white-space: pre-wrap!important;" \ "word-wrap: break-word!important;*white-space:normal!important;\">" diff_td2 = "</td><td style=\"width: 45%;padding: 8px;background-color: " \ "#dff0d8;line-height: 1.42857143;vertical-align: left;\">" diff_td3 = "</td><td style=\"width: 45%;padding: 8px;background-color: " \ "#dff0d8;line-height: 1.42857143;vertical-align: left;\">" with open("./result.html", mode="a", encoding="UTF-8") as f: print(td1 + "Response : ", td2 + json.dumps(response["primary"], indent=4, ensure_ascii=False) + "</pre>" + td2 + json.dumps(response["candidate"], indent=4, ensure_ascii=False) + "</pre></td></tr>", file=f) print("mark = ", mark_result) print("comp = ", comp_result) if (len(comp_result) - len(mark_result)) > 0: diff_td = "<tr><td rowspan=\"" + str(len(comp_result) - len(mark_result)) + "\" style=\"background-color: #bf466a\">" print("diff_td = ", diff_td) with open("./result.html", mode="a", encoding="UTF-8") as f: print(diff_td + "Diff Result ", file=f) for key in comp_result: if key not in mark_result: try: with open("./result.html", mode="a", encoding="UTF-8") as f: print(diff_td2 + key + "->" + str(noise_data2[key]["primary"]) + diff_td3 + str(noise_data2[key]["candidate"]) + "</td></tr><tr>", file=f) # print(key + " = A:" + str(noise_data2[key]["primary"]) + "<->D:" + str(noise_data2[key]["candidate"])
# + " Maybe a new bug.", file=f) print(key, "有可能是bug,要检查了。", str(noise_data2[key]["primary"]), str(noise_data2[key]["candidate"])) except Exception as e: with open("./result.html", mode="a", encoding="UTF-8") as f: print(td1 + "Diff Result : ", td2 + str(noise_data2[key]["primary"]) + "</pre>" + td2 + str(noise_data2[key]["candidate"]) + "</pre></td></tr>", file=f) # print(key + " = A:" + str(noise_data2[key]["primary"]) + "<->D:" + str(noise_data2[key]["candidate"])
# + " Maybe a new bug.", file=f) print(e) noise_data1.clear() noise_data2.clear() response.clear()
这里的response作为全局的变量进行使用。我们在获取了噪音数据noise_data1和noise_data2时,对噪音数据进行比对。
添加到result.html网页中,作为呈现的文本。
============================================