模拟支付宝、淘宝登录2
最终我决定通过webbrowser模拟登陆支付宝,获取数据。根据业务需求,我需要把获取支付宝的数据做成接口,供业务去调用。难点在于如何可以稳定的切换账号,并且保证服务24小时可用。需要处理一系列的异常和超时。缺点是这边变成单线程,登录获取数据只能一个进行完了再进行下一个。还有就是异地登陆会各种验证,常用地登陆完全没问题!然后破解ua算法也可以通过截获的ua的方式。
简单列下登录流程
爬虫服务 接口
1调用获取验证码接口,向队列中添加一个登录请求,等待(提示有几人排队)
2从队列获取一个登录用户
3进入登录首页,保存验证码图片,等待用户输入账号密码 返回图片验证码
4输入账号、密码和验证码,调用登录接口
5通过轮训的方式,等待接收用户的登录信息,开始登录
6验证是否登录成功,并判断是否需要短信验证 返回需要短信验证,再次调用登录接口
获取登录错误(然后进入步骤2) 返回登录错误
7通过轮训的方式,等待接收短信验证码,进行短信验证
8打开个人资料页面,获取个人信息 返回登录成功
如果个人信息获取错误 返回登录异常
9获取其他信息
10抓取其他信息 返回其他信息
11从队列获取下一个登录用户 ... ...
... ...
后来在登陆之后几分钟后会被强制退出和在切换用户登陆方面还得完善,公司也未采用,就只写了个demo