Python实例 | 贴吧签到
第一步 查看HTTP请求的内容
首先需要通过浏览器或者其他http包分析软件来观察,签到的时候进行了什么请求。
Firefox浏览器就足以做到这一点,Wireshark是更加专业的包分析软件,它除了能够分析HTTP协议的包,还能分析几乎所有通信协议的包。
签到的请求是一个POST请求,找到那个请求并点击,再在弹出的选项卡中选择参数,就可以看到POST的数据了
POST的数据有三项,
第一项是请求的编码,每次请求都不需要改变,
'kw'参数便是签到的贴吧名称,
第三个参数有点像是个密码,它其实由两部分组成,前一部分是一个md5哈希值,后一部分是自1970年1月1日0时0分0秒的秒数。难以置信的是不需要这个参数,也能签到成功
第二步 提取COOKIE
HTTP协议是无记忆的,网站需要额外通过HTTP请求的头部COOKIE字段来判断用户
一个网站所使用的COOKIE可能有多个,请求COOKIE作用域内的域名时,都会自动带上COOKIE,但并不是所有的COOKIE网站都会用上。
在Firefox浏览器中也可以很方便的获得COOKIE,还是在刚刚弹出的那个菜单中,消息头选项栏就可以找到COOKIE
贴吧签到所需要的COOKIE只有BDUSS这一项
获得了COOKIE,离成功就不远了
需要注意的是COOKIE是有有效期的,过了有效期就需要重新获取
第三步 编写Python代码
进行签到的核心是进行一个POST请求,在Python中urllib2包就可以做到这一点
一个POST请求主要有三部分,请求的url地址,请求的数据,和请求的头部。下面分别来分析如何构造这三部分
请求的地址可以在上面查看请求数据的时候一并找到
url = 'http://tieba.baidu.com/sign/add'
非常不优雅的是,请求的数据需要另一个包urllib来进行编码,说编码其实就是把字典转换成一个字符串,GET和POST请求的字符串数据形式是相同的
import urllib data = { "ie": "utf-8", "kw": tieba, #"tbs": "", } postData = urllib.urlencode(data)
这就是postData的真容:'kw=%E5%88%9B%E6%84%8F&ie=utf-8'
下一步就是加上请求的头部,构造整个请求了
headers = { "User-Agent": "Mozilla/5.0 Firefox/35.0", "Cookie": "BDUSS=AAAAAAAAAAAAAAAAAAAAAAAA", } request = urllib2.Request(url, postData, headers=headers) response = urllib2.urlopen(request)
根据官方的文档urlopen既可以是一个简单的url,也可以是一个Request对象,通过Request对象可以直接加上POST的数据以及头部
这样就大功告成了
第四步 接下来
可以检测签到是否成功,签到的POST请求会返回一个JSON文件,如果里面包含“success”的话,那就表明成功了
可以获取关注的所有贴吧,一键签到,这可是VIP的特权诶
进一步可以运行到云应用引擎上,在零点的时候自动签到,抢第一
……
全部代码下载地址:https://files.cnblogs.com/files/meelo/tieba.7z