urllib发送请求

from urllib import request

url = "http://www.baidu.com"
res = request.urlopen(url) # 获取相应

print(res.info()) # 响应头
print(res.getcode()) # 状态码
print(res.geturl()) # 返回响应地址

输出结果为：

from urllib import request

url = "http://www.baidu.com"
res = request.urlopen(url) # 获取相应

html = res.read()
html = html.decode("utf-8")
print(html)

上面这种方式是最初级的，没有考虑任何反爬机制，换个网站就行不通了

from urllib import request

url = "http://www.dianping.com"
res = request.urlopen(url) # 获取相应

print(res.info()) # 响应头
print(res.getcode()) # 状态码
print(res.geturl()) # 返回响应地址

最基础的措施为添加header，可以输入F12，在network选项中的Request Headers找到

找到后，给User-Agent添加引号，对冒号后面的部分也添加引号，然后写入header变量中

再通过request.Request(url,headers=header)来发送请求

# 添加header信息，这是最基本的反爬措施
url = "http://www.dianping.com"
header = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3741.400 QQBrowser/10.5.3863.400"
}
req = request.Request(url,headers=header)
res = request.urlopen(req) # 获取响应

print(res.info()) # 响应头
print(res.getcode()) # 状态码
print(res.geturl()) # 返回响应地址

posted @ 2020-05-31 10:52 chuyaoxin 阅读(298) 评论(1) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

公告

2025-01-26 星期天

09:31:00

空、星、海の夜 - THE BACK HORN

00:00 / 00:00

An audio error has occurred, player will skip forward in 2 seconds.

1 空、星、海の夜 THE BACK HORN
2 上弦の月 nero
3 河流蒋敦豪
4 说书人暗杠,寅子
5 九张机叶炫清
6 心照郑伊健

昵称： chuyaoxin
园龄： 5年5个月
粉丝： 45
关注： 27

+加关注

2025年1月

日

一

二

三

四

五

六

笛在月明楼

路虽远，行则将至。

urllib发送请求

公告

搜索

常用链接

我的标签

积分与排名

随笔分类 (283)

随笔档案 (229)

相册 (5)

阅读排行榜

评论排行榜

推荐排行榜

最新评论