摘要: 如有不得当之处,请联系我会及时删除 这次的抓取我用的是requests和Xpath,因为没有必要使用大型工具 import requests from lxml import etree 思路: 1.目的是下载爬虫教程 2.分析网页以及规则,使用Xpath简单获取下载url 3.循环下载 代码如下: 阅读全文
posted @ 2019-05-04 13:26 Tony学长 阅读(331) 评论(0) 推荐(0) 编辑
摘要: 引入BeautifulSoup: from bs4 import BeautifulSoup #意思就是从bs4这个包里面引入BeautifulSoup这个类 之后,使用以下语法来把请求之后的响应传入解析器: soup = BeautifulSoup(response.text, features= 阅读全文
posted @ 2019-05-04 13:14 Tony学长 阅读(1427) 评论(0) 推荐(0) 编辑