今天是:2010-03-14 ,纪念昨晚熬到3点!
题外话:模拟登陆请求页面这次我用了httpclient4.0,也顺便学习一下,4.0跟以前的版本用法上有很大的不同,具体情况Google一下就知道了,个人觉得知道原理就行了,至于开发包只要能实现目的用那个版本自己决定,这里不多说。
言归正传:
Step1、抓取登陆页:http://mail.qq.com/cgi-bin/loginpage
目的:获取表单提交的action和用于加密密码的ts值
注意:这里获取到得action有两个用途
1、当然是提交表单
2、抽出domain用于组装验证码请求url,因为验证码分布在多台机器,某台机器只能验证这台机器的验证码(所以一些旧的文章关于验证码获取的url不能用了)
补充:主页还有个rsa的公钥PublicKey,我直接拷贝出来使用,其他则用正则拿。
Step2、请求验证码:"http://"+domain+"/cgi-bin/getverifyimage?aid=23000101&"+Math.random()
注意:返回的验证码附上了cookie:authimgs_id和verifyimagesession(以前好像叫verifysession),所以拿验证码的时候必须把它们(不要漏了authimgs_id)保存下来,因为登陆请求的
时候 要用到。
Setp3、填充表单:
sid=0,2,zh_CN (默认值)
firstlogin=false (默认值)
starttime= (请求时间:js中: (new Date()).valueOf() ; java中:Long.toString(System.currentTimeMillis()))
redirecturl= (默认为空)
f=html (默认值)
p= (加密后的秘密:如果是jdk6.0可以调用存放rsa加密函数的js文件(好像是这个safeauth9206l.js,我是jdk5.0环境,所以未试过这种方法)来加密)
delegate_url= (默认为空)
s= (默认为空)
ts= (上面抓取首页的时候已获取)
from= (默认为空)
ppp = (默认为空)
chg = 1 (不用理,就填1好了)
checkisWebLogin = (当前日期所在一周中的第几天再乘3,例如:今天是星期日就是0*3=0,昨天是6*3=18)
uin= (qq号)
pp= (将原始密码的每一个字符替换为0,即密码长度个0组成的字符串)
verifycode=验证码(setp2已拿到)
aliastype=@qq.com (其他未试过)
表单填好了,就可以进入下一步,在这里推荐一个软件:charles,用这个东西可以看到页面http请求的细节,用来分析request and response非常方便
Setp4、登陆
提交表单前记得将setp2拿到的cookie放到请求header里,至于header还需不需要设其他值,个人水平有限,I don't know ~~!,我的做法反正在charles上看到的都弄上去应该没错
提交失败将返回错误页(errtype=1:密码错误、2:验证码错误、17:登陆太多次),否则返回一个跳转页,将跳转页上的urlHeader, sid , r三个 值拿下来重新组装进入首页的url
例如:http://m87.mail.qq.com/cgi-bin/frame_html?sid=0tMsQPhQJlbKWUsA&r=0f5b1e1f4898062431d5c1d21cbd244d
记得保存urlHeader (含有主页用到的域名信息)和 sid 获取联系人的时候要用到
Setp5、获取联系人
组装获取联系人分组列表页面的url :urlHeader+"addr_listall?sid="+_sid+"&sorttype=null&category=common"
例如:http://m87.mail.qq.com/cgi-bin/addr_listall?sid=0tMsQPhQJlbKWUsA&sorttype=null&category=common
进入了分组页,也就得到了进入每一组的url,进去拿就是了!
#补充一下个人的一些理解:上面整个过程必须保证始终使用同一个httpclient对象,httpclient隐性地为我们完成了session维持的工作!
(有理解错的,请大侠们指出以便修正,俺水平低下但好学~~)
#这里不提供源码,因为qq邮箱稍有改动,程序就可能用不了,关键是思路!以不变应万变~~
参考资料:
http://www.cnblogs.com/huangcheng/archive/2009/09/14/1566198.html
http://blog.csdn.net/gtuu0123/archive/2009/11/14/4809431.aspx
@QQ邮箱改用https协议了,而且邮箱联系人那个页面该版了,不过稍作改动,程序仍然可用 (2010-06-26)