Python爬虫(一)

import urllib2

response = urllib2.urlopen("http://www.baidu.com")
print response.read()

该代码抓取的是百度的源码


其实上面的urlopen参数可以传入一个request请求,它其实就是一个Request类的实例,构造时需要传入Url,Data等等的内容。比如上面的两行代码,我们可以这么改写

import urllib2

request = urllib2.Request("http://www.baidu.com")
response = urllib2.urlopen(request)
print response.read()

其结果完全一样

GET与POST数据传送的区别:

get是直接以链接方式访问、链接中包含了所有的参数,当然如果包含了密码的话是一种不安全的选择,不过你可以直观地看到自己提交了什么内容。POST则不会在网址上显示所有的参数,不过如果你想直接查看提交了什么就不太方便了,



有待更新、敬请关注


posted @ 2016-05-25 18:33  Tovi  阅读(140)  评论(0编辑  收藏  举报