摘要: 内容整理自中国大学MOOC——北京理工大学-蒿天-基于bs4库的HTML页面遍历方法 我们使用如下链接作为实验对象 https://python123.io/ws/demo.html 页面信息如下 利用requests库爬取出网页的HTML完整代码 1 import requests 2 r = r 阅读全文
posted @ 2020-02-10 20:50 大西young 阅读(3731) 评论(0) 推荐(0) 编辑
摘要: 内容整理自中国大学MOOC——北京理工大学-蒿天-Python网络爬虫与信息提取 利用requests.get()方法爬取网页图片,并保存至本地 1 import requests 2 3 path = "D:/picture.jpg" #设定保存路径 4 url = "http://img.kit 阅读全文
posted @ 2020-02-10 20:46 大西young 阅读(1229) 评论(0) 推荐(0) 编辑