selenium 页面加载以及4种等待

1、页面加载

1.1、页面加载超时设置

通过driver.set_page_load_timeout()来设置页面加载超时时间

1.2、页面加载策略设置

首选需要明白的一点是,如果什么都不设置,通常,以chrome浏览器为例,所有的元素定位是在页面被完全加载后(页面tab不再转圈)才开始。

有时候其实想要的元素已经加载出来了,只是页面还在加载其他东西,例如图片,此时若不想继续等待直接执行元素定位操作,则需要在创建driver的时候设置页面加载策略:

当调用driver.get("https://xxxx.xxx.xxx")来访问某页面时,get方法通常会阻塞浏览器直到页面完全加载后才执行后面的动作,若一个页面加载过慢,则会导致get方法一直阻塞。有时候希望页面在加载过程中就开始检测元素是否存在,而不是等到页面加载完了才开始检测,想要实现这个效果,可以用DesiredCapabilities类下的setPageLoadStrategy方法(Python,Chrome浏览器):

from selenium import webdriver

from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
from selenium.webdriver.support.ui import WebDriverWait

desired_capabilities = DesiredCapabilities.CHROME # 修改页面加载策略
desired_capabilities["pageLoadStrategy"] = "none" # 注释这两行会导致最后输出结果的延迟,即等待页面加载完成再输出
#注:2021/12/20 在谷歌浏览器96.0.4664.110上验证出效果。
driver = webdriver.Chrome('browsers/chromedriver.exe') wait = WebDriverWait(driver, 10) #后面可以使用wait对特定元素进行等待 driver.get('http://qzone.qq.com/') # some code to work. print("Reach end.")

其中PageLoadStrategy有三种选择:

(1) none: 当html下载完成之后,不等待解析完成,selenium会直接返回

(2) eager: 要等待整个dom树加载完成,即DOMContentLoaded这个事件完成,仅对html的内容进行下载解析。注:在谷歌浏览器96.0.4664.110验证不支持eager。

(3) normal: 即正常情况下,selenium会等待整个界面加载完成(指对html和子资源的下载与解析,如JS文件,图片等,不包括ajax

以下这段来自https://blog.csdn.net/wkb342814892/article/details/81611737,感谢原作者

实际上,对于一个新加载的dom,页面啥时候开始接受命令由页面的加载策略决定,也就是说,我们通过修改页面加载策略,可以使页面即使处于加载中,也能接受我们的命令,从这点可以解决webdriver.get的阻塞问题。而每类webdriver都有一个对应的配置文件放在特定的类DesiredCapabilities里面,通过修改里面的pageLoadStrategy,可以使webdriver的页面加载策略发生改变。

上面的代码用了最后一种解析方式——none,不作等待,直接返回,然后在后面的代码中可以用explicit_wait或者implicit_wait等方式来对特定元素进行等待捕捉。

 

2、4种等待

UI自动化测试,大多都是通过定位页面元素来模拟实际的生产场景操作。但在编写自动化测试脚本中,经常出现元素定位不到的情况,究其原因,无非两种情况:1、有frame;2、没有设置等待。

因为代码运行速度和浏览器加载渲染速度,不是一个量级,所以导致了这种情况发生。webdriver提供了3种类型的等待:显式等待、隐式等待、强制等待。

2.1、强制等待

即sleep()方法,由python中的time模块提供,强制让代码等待xxx时间,无论前面的代码是否执行完成或者还未完成,都必须等待设定的时间。

不建议用这种等待方法,严重影响代码的执行速度。

示例代码如下:

复制代码
 1 # coding = utf-8
 2 from selenium import webdriver
 3 from time import sleep
 4  
 5 driver = webdriver.Chrome("F:\安装工具\python\chromedriver.exe")
 6 driver.get('http://www.cnblogs.com/imyalost/')
 7 
 8 sleep(5)
 9  
10 print(driver.current_url)
11 driver.quit()
复制代码

代码解析:

本例中,设置强制等待时间为5秒,5秒之后,打印获取到的当前页面的url,然后关闭窗口。

这种强制等待的方法,在debug时候很有用,不过建议慎用这种方法,因为太死板,严重影响程序执行速度!

 

2.2、隐式等待

隐式等待是设置全局的查找页面元素的等待时间,在这个时间内没找到指定元素则抛出异常,只需设置一次。

driver.manage().timeouts().implicitlyWait(10,TimeUnit.SECONDS);

所有的findElement方法都会隐式等待10s

 

2.3、显示等待

定义:等待某个条件成立时继续执行,否则在达到最大时长时抛出异常(TimeoutException);

WebDriverWait类是由webdriver提供的等待方法,配合该类提供的until()和until_not()方法一起使用,就可以根据判断条件而灵活进行等待,格式如下:
复制代码
1 WebDriverWait(driver,timeout,poll_frequency=0.5,ignored_exceptions=None)
2 driver:浏览器驱动
3 timeout:最长超时时间
4 poll_frequency:检测间隔时间,默认0.5s
5 ignored_exceptions:超时后的异常信息,默认情况抛出NoSuchElementException异常
6 WebDriverWait()一般由until()或until_not方法配合使用,下面是这两种方法的说明: 7 until(method,message=''):调用该方法提供的驱动程序作为一个参数,直到返回值为True; 8 until_not(method,message=''):调用该方法提供的驱动程序作为一个参数,直到返回值为Flase;
复制代码

示例代码如下:

复制代码
 1 # coding = utf-8
 2 from selenium import webdriver
 3 from selenium.webdriver.support.wait import WebDriverWait
 4 from selenium.webdriver.support import expected_conditions as EC
 5 from selenium.webdriver.common.by import By
 6  
 7 driver = webdriver.Chrome("F:\安装工具\python\chromedriver.exe")
 8 driver.implicitly_wait(10)
 9 driver.get('http://www.cnblogs.com/imyalost/')
10 locator = (By.LINK_TEXT, '老_张')
11  
12 try:
13     WebDriverWait(driver, 20, 0.5).until(EC.presence_of_element_located(locator))
14     print(driver.find_element_by_link_text('老_张').get_attribute('href'))
15 finally:
16     driver.close()
复制代码

代码解析:

本例中,通过as关键字将expected_conditions重命名为EC,并调用presence_of_element_located()方法判断元素是否存在;

上面的例子中,同时使用了隐性等待和显性等待,但是需要注意的是:等待的最长时间取两者之中的最大值;

expected_conditions类提供的预期条件判断方法如下:
复制代码
 1 title_is: 判断当前页面的title是否完全等于(==)预期字符串,返回布尔值
 2 title_contains : 判断当前页面的title是否包含预期字符串,返回布尔值
 3 presence_of_element_located : 判断某个元素是否被加到了dom树里,并不代表该元素一定可见
 4 visibility_of_element_located : 判断某个元素是否可见. 可见代表元素非隐藏,并且元素的宽和高都不等于0
 5 visibility_of : 跟上面的方法做一样的事情,只是上面的方法要传入locator,这个方法直接传定位到的element就好了
 6 presence_of_all_elements_located : 判断是否至少有1个元素存在于dom树中。举个例子,如果页面上有n个元素的class都是‘column-md-3‘,那么只要有1个元素存在,这个方法就返回True
 7 text_to_be_present_in_element : 判断某个元素中的text是否 包含 了预期的字符串
 8 text_to_be_present_in_element_value : 判断某个元素中的value属性是否 包含 了预期的字符串
 9 frame_to_be_available_and_switch_to_it : 判断该frame是否可以switch进去,如果可以的话,返回True并且switch进去,否则返回False
10 invisibility_of_element_located : 判断某个元素中是否不存在于dom树或不可见
11 element_to_be_clickable : 判断某个元素中是否可见并且是enable的,这样的话才叫clickable
12 staleness_of : 等某个元素从dom树中移除,注意,这个方法也是返回True或False
13 element_to_be_selected : 判断某个元素是否被选中了,一般用在下拉列表
14 element_selection_state_to_be : 判断某个元素的选中状态是否符合预期
15 element_located_selection_state_to_be : 跟上面的方法作用一样,只是上面的方法传入定位到的element,而这个方法传入locator
16 alert_is_present : 判断页面上是否存在alert
复制代码

 

2.4、流畅等待: FluentWait

与显示等待的 WebDriverWait类似,区别是WebDriverWait已经设置好几个等待条件,而流畅等待 FluentWait可以自己设置等待条件。

 

3、如何提高运行速度

设置等待时间的时候,少用sleep,尽量不用implicitly_wait,多用显式等待方法;

 

参考链接:

https://www.cnblogs.com/imyalost/p/7420924.html

https://www.cnblogs.com/qianjin100/p/9910699.html

https://blog.csdn.net/ouyanggengcheng/article/details/83036680

posted @ 2021-12-17 16:35  超级宝宝11  阅读(10796)  评论(0编辑  收藏  举报