摘要: 注意:lxml要和xpath一起使用,这里的xpath获取的结果是列表,不能使用extract_first()和extract()方法 一、lxml(解析库) 1、优点:速度快,用于爬取大型网站 2、安装:https://www.cnblogs.com/wt7018/p/11773612.html 阅读全文
posted @ 2019-11-05 23:25 市丸银 阅读(124) 评论(0) 推荐(0) 编辑
摘要: 官网:https://www.crummy.com/software/BeautifulSoup/bs4/doc/ 参鸟教程:http://www.jsphp.net/python/show-24-214-1.html 自己写的日记:https://i-beta.cnblogs.com/diarie 阅读全文
posted @ 2019-11-05 21:59 市丸银 阅读(84) 评论(0) 推荐(0) 编辑
摘要: 官网: https://requests.kennethreitz.org//zh_CN/latest/user/quickstart.html 测试网站:httpbin.org 注意:重定向 requests.get(allow_redirects=False) 注意:其它看官网 1、带heade 阅读全文
posted @ 2019-11-05 20:37 市丸银 阅读(109) 评论(0) 推荐(0) 编辑
摘要: https://blog.csdn.net/shishu8385/article/details/87787465 阅读全文
posted @ 2019-11-05 17:29 市丸银 阅读(295) 评论(0) 推荐(0) 编辑