彼方尚有荣光剑开天门

爬虫学习1

吕洞玄·2022-05-02 21:42·16 次阅读

爬虫学习1

1.爬取网页2.逐一解析数据3.保存数据
获取一个get请求
import urllib.request
response=urllib.request.urlopen("http://www.baidu.com" (可以在这里加上timeout=111,设定一个超时时间,一般在上面加上try,下面加上except urllib.error.urlerror as e print("time out")) )
打开这个页面,直接把返回的页面数据传给response。可以直接打印出来。
print(response.read());也可以用 print(response.read().decode(utf-8));
直接就是网页的源代码。
用httpbin.org查看响应头
获取一个post请求
import urllib.parse
data=bytes(urllib.parse.urlencode({""}),encoding="utf-8")
response=urllib.request.urlopen("http://httpbin.org/post",data=data)
print(response.read().decode(utf-8));
.read换成.status会返回它的响应时间
response.getheader是获取头部信息。如果在后面再加入("Server")可以获取单个信息。

posted @   吕洞玄  阅读(16)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 25岁的心里话
· 按钮权限的设计及实现
点击右上角即可分享
微信分享提示