Python爬虫爬取知乎文章内容（解决最新js反爬2021.9 x-zse-96 2.0版本加密破解分析）

有个需求爬取知乎文章，正好记录下爬取过程以及出现问题并解决方法
我是在没有登录的情况下爬取文章的

本文仅供研究与学习使用
知乎现今的 x-zse 参数的加密方法已升级成了：x-zse-96 2.0版本。
来看这篇帖子的应该都知道，这个参数动态唯一，没有就拿不到api数据。
查阅了网上有关文章，仅有x-zse-86 2.0版本的解密方法，现今已不适用，加上之前写的文章中有提及该解密方法，所以写一篇最新的，供大家研究与学习。

1.F12进入源码分析

2.响应json内容

https://www.zhihu.com/api/v4/search_v3?t=general&q=探店&correction=1&offset=20&limit=20&filter_fields=&lc_idx=20&show_all_topics=0&search_hash_id=7d9f263f8c4370bb21917e1edf6543da&vertical_info=0%2C1%2C1%2C0%2C0%2C0%2C0%2C0%2C0%2C1

3.断点调试

4.md5参数加密

不难发现明文是 headers 里的 x-zse-93 + url + cookie.d_c0
知乎貌似一直都是采用 md5 加密方式进行数据加密的，直接上去测就好了。
在终端输入：r.default(d)

运行结果：

如果您觉得阅读本文对您有帮助，请点一下“推荐”按钮，您的“推荐”将是我最大的写作动力！欢迎各位转载！

posted @ 2021-09-16 11:19 莫贞俊晗阅读(1313) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
· 三行代码完成国际化适配，妙~啊~

历史上的今天：
2020-09-16 若遇到APP无法抓包怎么办，可以通过安装Drony 进行转发抓包

公告

昵称：莫贞俊晗
园龄： 5年2个月
粉丝： 49
关注： 8

+加关注

2025年3月

日

一

二

三

四

五

六

莫贞俊晗

Python爬虫爬取知乎文章内容（解决最新js反爬2021.9 x-zse-96 2.0版本加密破解分析）

1.F12进入源码分析

2.响应json内容

3.断点调试

4.md5参数加密

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论