Python爬虫(一)
import urllib2 response = urllib2.urlopen("http://www.baidu.com") print response.read()
该代码抓取的是百度的源码
其实上面的urlopen参数可以传入一个request请求,它其实就是一个Request类的实例,构造时需要传入Url,Data等等的内容。比如上面的两行代码,我们可以这么改写
import urllib2 request = urllib2.Request("http://www.baidu.com") response = urllib2.urlopen(request) print response.read()
其结果完全一样
GET与POST数据传送的区别:
get是直接以链接方式访问、链接中包含了所有的参数,当然如果包含了密码的话是一种不安全的选择,不过你可以直观地看到自己提交了什么内容。POST则不会在网址上显示所有的参数,不过如果你想直接查看提交了什么就不太方便了,
有待更新、敬请关注