摘要: 问题描述: 新打开的页面url不变,只是网页内容变了,然后使用drive.page_source得到的都是第一页的html代码,并不是当前页面的html代码。 1. 原因:webdriver仍默认在原页面下获取标签等信息; 解决方法:采用切换页面句柄的方式解决; #获取当前页面句柄 normal_w 阅读全文
posted @ 2020-02-22 21:03 田智凯 阅读(2775) 评论(0) 推荐(0) 编辑
摘要: 问题:selenium已经放弃PhantomJS,建议使用火狐或者谷歌无界面浏览器。 解决方案1: selenium版本降级 通过pip install selenium默认安装版本。 (通过pip show selenium显示版本)将其卸载pip uninstall selenium,重新安装并 阅读全文
posted @ 2020-02-22 12:26 田智凯 阅读(909) 评论(0) 推荐(0) 编辑
摘要: 问题: 换页url不边,Ajax加载,于是进行抓包: 可是发现换页的时候Request URL也不变(看很多类似教程都是找url变化规律) 这时候我选择使用selenium和Chrome配合,模拟浏览器输入页数获得网页: 源代码: from lxml import etreeimport reque 阅读全文
posted @ 2020-02-22 11:44 田智凯 阅读(509) 评论(0) 推荐(0) 编辑