如何模拟登陆添加了CSRF保护的网站

上次写了篇文章,内容是如何利用WebClient模拟登陆CSRF控制的网站,回复中有人还是不理解,现在另开一篇,打算说说用Python如何来登陆。

开写之前,先说下为什么webrequest不行,常规情况下,我们在利用webrequest的时候,都是如下的形式:

 1 string url = "loginurl";
 2 StringBuilder sb = new StringBuilder();
 3 sb.Append("username=un");
 4 sb.Append("&password=up");
 5 sb.Append("&service=sv");
 6 HttpWebRequest requestget = (HttpWebRequest)WebRequest.Create(url);
 7 byte[] postData = Encoding.UTF8.GetBytes(sb.ToString());
 8 using (Stream stream = requestget.GetRequestStream())
 9 {
10     stream.Write(postData, 0, postData.Length);
11 }
12 WebResponse reponse1 = requestget.GetResponse();
13 StreamReader sr2 = new StreamReader(reponse1.GetResponseStream(), Encoding.UTF8);
14 string html2 = sr2.ReadToEnd();

可关键是我们POST过去的数据并没有服务器所认可的CSRF值,在GetResponse处就会报错,要是我们在上面第六行后面添加如下代码:

1 WebResponse reponseget = requestget.GetResponse();
2 StreamReader sr = new StreamReader(reponseget.GetResponseStream(), Encoding.UTF8);
3 string html = sr.ReadToEnd();
4 string regx = "<input type=\"hidden\" id=\"lt\" name=\"lt\" value=\"(?<PID>\\S+?)\" />";
5 string token = Regex.Match(html, regx).Groups[1].Value;
6 sb.Append("&lt=" + token);

先获得其值,并加入到postdata的stringbuild中,其它不变,当执行到GetRequestStream的时候,会报System.Net.ProtocolViolationException的错误,此时如果你重新create一个httpwebrequest又会导致csrf值失效。这些就是在模拟登陆具有CSRF保护网站时碰到的问题,所以才有第一篇文章重写WebClient来达到。

今天碰巧在写Python代码,就想利用Python看看怎么来做这样带保护的模拟登陆,简单说来,代码如下:

 1 from urllib.parse import urlencode
 2 url = 'somurl'
 3 r,c = h.request(url,'GET')
 4 sc = c.decode('utf-8')
 5 import re
 6 regx = r'<input type="hidden" id="lt" name="lt" value="(\S+?)" />';
 7 pm = re.search(regx,sc)
 8 csrf = pm.group(1)
 9 body = {'username':'user','password':'pass','lt':csrf,'service':'url'}
10 r,c = h.request(url,'POST',body=urlencode(body))
11 print (c.decode("UTF-8"))

感觉还是满简单的。当然我们也还是要利用cookie来达到目的,上面是主要的代码,大家可以参考下。

变量h的定义如下:

1 h = httplib2.Http('.cache')

可以看到,用的是httplib2这个库。在Python中推荐用其来代替标准库的http客户端。

 

 

posted @ 2014-05-28 18:54  洋芋,阿喜欢!  阅读(5153)  评论(2编辑  收藏  举报