python处理json时遇到一些特殊的字符

需要把特殊字符替换到才能使用loads方法:

复制代码
import json
import re
import requests

headers = {
    'authority': 'www.ixigua.com',
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.82 Safari/537.36',
    'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',
    'cookie': 'MONITOR_WEB_ID=ce7600a7-1408-4fdf-a025-a2edca498529; ttwid=1%7C1qziXR4rgPRdSk9hqE41S7EUfnClVha-Uab_IX4ASHs%7C1632844963%7C957b513101d4e90853a5fbd52c0ebc74ff69b5b5f2015855bc3c89c0a104caee; ixigua-a-s=0',
}

response = requests.get(
    'https://www.ixigua.com/search/100%5E%%5EE5%5E%%5E85%5E%%5E83%5E%%5EE5%5E%%5E90%5E%%5E83%5E%%5EE9%5E%%5E81%5E%%5E8D%5E%%5EE7%5E%%5EBE%5E%%5E8E%5E%%5EE9%5E%%5EA3%5E%%5E9F%5E%%5EE8%5E%%5E8A%5E%%5E82/',
    headers=headers)


pattern = re.compile("_SSR_HYDRATED_DATA=(.*?)</script>")
res = pattern.search(response.text).group(1)
aa = res.replace("\\u002F", "/").replace("\\u003C", "<").replace("\\u003E", ">").replace("\\\"", "'").replace(
    "undefined", "\"\"")

print(json.loads(aa))
复制代码

 

posted @   阿布_alone  阅读(617)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
TOP
点击右上角即可分享
微信分享提示