python爬虫基础14-selenium大全8/8-常见问题

Selenium笔记（8）常见的坑

通常在我们使用xpath时，可以使用@class的方式直接获取节点的属性，如下所示：

page.xpath('//div/a/@class')

但在Selenium中不支持这种用法，只能在找到节点后，使用get_attribute(name)方法来获取属性：

page.xpath('//div/a').get_attribute('class')

同样的，Selenium同样不支持Xpath中的string()，text()这类的方法，只能获取元素节点。

有很多时候，一个简单的元素，明明也加了显式等待，但就是找不到，代码在仔细查看过后也没有问题后，多半是以下这几种情况：

这时候应该设置好分辨率，使当前元素能够显示到页面中。

有些页面为了性能的考虑，页面下方不在当前屏幕中的元素是不会加载的，只有当页面向下滚动时才会继续加载。

而selenium本身不提供向下滚动的方法，所以我们需要去用JS去滚动页面：

driver.execute_script("window.scrollTo(0, document.body.scrollHeight)")

网上查到的一些滚动方式在Chrome上无效。但这一句是有效的。

有时候因为一些弹出元素的原因，如果还使用EC.presence_of_element_located()的话，我们需要定位的元素就无法被找到，这个时候我们就应该改变我们判断元素的方法：

element = WebDriverWait(driver, 10).until(
    EC.visibility_of_element_located((By.XPATH, ''))
)

使用EC.visibility_of_element_located()方法可以在等待到当前元素可见后，才获取元素。

在我们找不到元素，或者跟元素无法交互时，应该多去根据当前的情况，灵活选择显式等待的判断方式。

posted @ 2019-06-06 16:05 博立克阅读(268) 评论(0) 收藏举报

刷新页面返回顶部