摘要:
1.对于爬取模拟用户登陆的网站,可以采用requests.session或selenium进行操作,当然有些网站需要进行图片验证,则可以手工输入,或者采用云打码等平台进行识别 2.对于请求的参数是加密的网站,则需要详细分析js代码。 3.静态网站,例如京东,其网站为html页面,然后通过渲染进行的。 阅读全文
摘要:
方案: 该网站用来进行翻译。通过对js代码进行分析,其主要是采用md5对输入的salt和sign参数进行加密实现的。因此技术方案有两种: 方案一:自己添加md5函数进行加密post数据;方案二:采用js2py包进行添加js文件,模拟执行相关js代码 阅读全文