Python实例 | 贴吧签到

第一步 查看HTTP请求的内容

首先需要通过浏览器或者其他http包分析软件来观察,签到的时候进行了什么请求。

Firefox浏览器就足以做到这一点,Wireshark是更加专业的包分析软件,它除了能够分析HTTP协议的包,还能分析几乎所有通信协议的包。

签到的请求是一个POST请求,找到那个请求并点击,再在弹出的选项卡中选择参数,就可以看到POST的数据了

POST的数据有三项,

第一项是请求的编码,每次请求都不需要改变,

'kw'参数便是签到的贴吧名称,

第三个参数有点像是个密码,它其实由两部分组成,前一部分是一个md5哈希值,后一部分是自1970年1月1日0时0分0秒的秒数。难以置信的是不需要这个参数,也能签到成功

第二步 提取COOKIE

HTTP协议是无记忆的,网站需要额外通过HTTP请求的头部COOKIE字段来判断用户

一个网站所使用的COOKIE可能有多个,请求COOKIE作用域内的域名时,都会自动带上COOKIE,但并不是所有的COOKIE网站都会用上。

在Firefox浏览器中也可以很方便的获得COOKIE,还是在刚刚弹出的那个菜单中,消息头选项栏就可以找到COOKIE

贴吧签到所需要的COOKIE只有BDUSS这一项

获得了COOKIE,离成功就不远了

需要注意的是COOKIE是有有效期的,过了有效期就需要重新获取

第三步 编写Python代码

进行签到的核心是进行一个POST请求,在Python中urllib2包就可以做到这一点

一个POST请求主要有三部分,请求的url地址,请求的数据,和请求的头部。下面分别来分析如何构造这三部分

请求的地址可以在上面查看请求数据的时候一并找到

url = 'http://tieba.baidu.com/sign/add'

 非常不优雅的是,请求的数据需要另一个包urllib来进行编码,说编码其实就是把字典转换成一个字符串,GET和POST请求的字符串数据形式是相同的

import urllib

data = {
    "ie": "utf-8",
    "kw": tieba,
    #"tbs": "",
}

postData = urllib.urlencode(data)

这就是postData的真容:'kw=%E5%88%9B%E6%84%8F&ie=utf-8'
下一步就是加上请求的头部,构造整个请求了

headers = {
    "User-Agent": "Mozilla/5.0 Firefox/35.0",
    "Cookie": "BDUSS=AAAAAAAAAAAAAAAAAAAAAAAA",
}

request = urllib2.Request(url, postData, headers=headers)
response = urllib2.urlopen(request)

根据官方的文档urlopen既可以是一个简单的url,也可以是一个Request对象,通过Request对象可以直接加上POST的数据以及头部

这样就大功告成了

第四步 接下来

可以检测签到是否成功,签到的POST请求会返回一个JSON文件,如果里面包含“success”的话,那就表明成功了

可以获取关注的所有贴吧,一键签到,这可是VIP的特权诶

进一步可以运行到云应用引擎上,在零点的时候自动签到,抢第一

……

 

全部代码下载地址:https://files.cnblogs.com/files/meelo/tieba.7z

posted on 2015-02-02 22:40  meelo  阅读(1055)  评论(0编辑  收藏  举报