爬虫3:表单登陆
今天被登陆问题弄得各种头疼到现在也没有弄清楚,哎,还碰到了验证码的问题
只是理解了post表单的问题,看到知乎上一位总结得很好,所以还是把并不成功的代码写上来
Urllib2 处理表单登陆的情况 import urllib import urllib2 data= urllib.urlencode(data) request = urllib2.Request(url=url, data=data) response = urllib2.urlopen(request )
然后是我自己的一段代码,并没有成功,不过post表单应该都是这个方法
后面解决了问题,再另外贴代码
import urllib import urllib2 class DB: def __init__(self): self.url='登陆地址' self.postdata = urllib.urlencode({ 'form_email': '我的邮箱', 'form_password': '我的密码' }) def getPage(self): request = urllib2.Request( url=self.url, data=self.postdata ) result=urllib2.urlopen(request) print result.read() tester = DB() tester.getPage()
我走的很慢,但从不后退