Python模拟登录实战(一)

今天,学习了模拟登录新浪微博。模拟登录主要有两种方式,一、利用Cookie;二、模仿浏览器的请求,发送表单。

法一:

Cookie:指某些网站为了辨别用户身份而储存在用户本地终端上的数据(通常经过加密)。当登录一个网站时,网站往往会要求用户输入用户名和密码,并且用户可以勾选“下次自动登录”。如果勾选了,那么下次访问同一网站时,用户会发现没输入用户名和密码就已经登录了。这正是因为前一次登录时,服务器发送了包含登录凭据(用户名加密码的某种加密形式)的Cookie到用户的硬盘上。第二次登录时,(如果该Cookie尚未到期)浏览器会发送该Cookie,服务器验证凭据,于是不必输入用户名和密码就让用户登录了。

代码格式如下:

cookie = {'Cookie' : ''}
html = requests.get(url,cookies=cookie)

法二:

通过模拟浏览器请求的方式来模拟登录微博。

1、先手动登录微博,推荐移动端(PC端用户名和密码都进行了极其复杂的加密,不推荐)

发现表单中‘password_xxxx,vk,capId’是不知道的,那就要通过分析原始登陆界面来获取了。

现将它们提交表单即可,代码如下:

 1 #!/usr/bin/env python
 2 # -*- coding:utf-8 -*-
 3 __author__ = 'ziv·chan'
 4 
 5 from lxml import etree
 6 from PIL import Image
 7 import requests
 8 import re
 9 
10 
11 user_agent = 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.94 Safari/537.36'
12 referer = 'http://login.weibo.cn/login/?ns=1&revalid=2&backURL=http%3A%2F%2Fweibo.cn%2F&backTitle=%CE%A2%B2%A9&vt='
13 
14 headers = {
15         'User-Agent' : user_agent,
16         'Host' : 'login.weibo.cn',
17         'Origin' : 'http://login.weibo.cn',
18         'Referer' : referer
19 }
20 
21 session = requests.session()
22 
23 # 注意URL的选择
24 url = 'https://login.weibo.cn/login/'
25 html = session.get(url,headers=headers)
26 pageCode = html.text
27 pattern = re.compile('password" name="(.*?)".*?name="vk" value="(.*?)".*?"capId" value="(.*?)"',re.S)
28 items = re.findall(pattern,pageCode)[0]
29 password,vk,capId = items
30 # 上面就依次获得了password_xxxx,vk,capId
31 
32 cap_url = 'http://weibo.cn/interface/f/ttt/captcha/show.php?cpt=' + items[2]
33 captcha = session.get(cap_url,headers=headers)
34 with open('cap.png','wb') as f:
35     f.write(captcha.content)
36     f.close()
37     im = Image.open('cap.png')
38     im.show()
39     im.close
40     cap_code = raw_input('请输入验证码:')
41 
42 
43 form_data = {
44         'mobile' : '18362972928',
45         password : 'ChelseaFC.1',
46         'code' : cap_code,
47         'remember' : 'on',
48         'backURL' : 'http%3A%2F%2Fweibo.cn%2F',
49         'backTitle' : '微博',
50         'tryCount' : '',
51         'vk' : vk,
52         'capId' : capId,
53         'submit' : '登录'
54 }
55 
56 
57 
58 session.post(url,data=form_data,headers=headers)
59 
60 url_logined = 'http://weibo.cn/'
61 html_2 = session.get(url_logined)
62 html_2.encoding = 'utf-8'
63 pageCode_2 = html_2.content
64 Selector = etree.HTML(pageCode_2)
65 content = Selector.xpath('//span[@class="ctt"]')
66 for each in content:
67     text = each.xpath('string(.)')
68     print text

以上。

posted @ 2016-05-18 21:57  夜雨寄北丶  阅读(15363)  评论(0编辑  收藏  举报