摘要: #!/usr/bin/python2.7 # -*- coding:utf-8 -*- """ 12306自动登录: - 先校验验证码 - 再校验用户名密码 """ import ssl import json import urllib import urllib2 import cookielib # 用来保存cookie c = cookielib.LWPCookie... 阅读全文
posted @ 2017-11-18 22:57 lixin[at]hitwh 阅读(1705) 评论(0) 推荐(0) 编辑
摘要: #!/usr/bin/python2.7 # -*- coding:utf-8 -*- # 2017-10-19 """ 12306 抢票 网页分析 - 查看网页源码 - 判断是否通过异步加载或者框架的形式接收并展示数据 - 数据加密过,然后前端再通过js解密并展示(即js混淆) urllib2.URLError: 证书作用:保证数据在传输的过程中不会被篡改或截... 阅读全文
posted @ 2017-11-18 22:55 lixin[at]hitwh 阅读(780) 评论(0) 推荐(0) 编辑
摘要: 一、start_requests Scrapy初开始运行的时候是执行的是父类Spider里的start_requests方法 也可以自己重写: 也可以用 return [Request(...)] 的形式替代 yield Reuest(...) 因为源码里会对 start_requests()方法的 阅读全文
posted @ 2017-11-18 22:42 lixin[at]hitwh 阅读(1460) 评论(0) 推荐(0) 编辑