爬虫(三)-之Urllib库的基本使用

 

什么是Urllib

Urllib是python内置的HTTP请求库

包括以下模块

urllib.request  请求模块

urllib.error  异常处理模块

urllib.parse    url解析模块

urllib.robotparser  robots.txt解析模块

urlopen

关于urllib.request.urlopen参数的介绍:

urllib.request.urlopen(url,data=None,[timeout,]*,cafile=None,capath=None,cadefault=False,context=None)

url参数的使用

先写一个简单的例子:

import urllib.request

response = urllib.request.urlopen('http://www.baidu.com')
print(response.read().decode('utf-8'))

urlopen一般常用的有三个参数,它的参数如下:
urllib.requeset.urlopen(url,data,timeout)
response.read()可以获取到网页的内容,如果没有read(),将返回如下内容

data参数的使用

上述的例子是通过请求百度的get请求获得百度,下面使用urllib的post请求

 

posted @ 2019-01-22 10:33  三千丝  阅读(159)  评论(0编辑  收藏  举报