selenium 页面加载以及4种等待
1、页面加载
1.1、页面加载超时设置
通过driver.set_page_load_timeout()
来设置页面加载超时时间
1.2、页面加载策略设置
首选需要明白的一点是,如果什么都不设置,通常,以chrome浏览器为例,所有的元素定位是在页面被完全加载后(页面tab不再转圈)才开始。
有时候其实想要的元素已经加载出来了,只是页面还在加载其他东西,例如图片,此时若不想继续等待直接执行元素定位操作,则需要在创建driver的时候设置页面加载策略:
当调用driver.get("https://xxxx.xxx.xxx")来访问某页面时,get方法通常会阻塞浏览器直到页面完全加载后才执行后面的动作,若一个页面加载过慢,则会导致get方法一直阻塞。有时候希望页面在加载过程中就开始检测元素是否存在,而不是等到页面加载完了才开始检测,想要实现这个效果,可以用DesiredCapabilities类下的setPageLoadStrategy方法(Python,Chrome浏览器):
from selenium import webdriver from selenium.webdriver.common.desired_capabilities import DesiredCapabilities from selenium.webdriver.support.ui import WebDriverWait desired_capabilities = DesiredCapabilities.CHROME # 修改页面加载策略 desired_capabilities["pageLoadStrategy"] = "none" # 注释这两行会导致最后输出结果的延迟,即等待页面加载完成再输出
#注:2021/12/20 在谷歌浏览器96.0.4664.110上验证出效果。
driver = webdriver.Chrome('browsers/chromedriver.exe') wait = WebDriverWait(driver, 10) #后面可以使用wait对特定元素进行等待 driver.get('http://qzone.qq.com/') # some code to work. print("Reach end.")
其中PageLoadStrategy有三种选择:
(1) none: 当html
下载完成之后,不等待解析完成,selenium
会直接返回
(2) eager: 要等待整个dom
树加载完成,即DOMContentLoaded
这个事件完成,仅对html
的内容进行下载解析。注:在谷歌浏览器96.0.4664.110验证不支持eager。
(3) normal: 即正常情况下,selenium
会等待整个界面加载完成(指对html
和子资源的下载与解析,如JS文件,图片等,不包括ajax
)
以下这段来自https://blog.csdn.net/wkb342814892/article/details/81611737,感谢原作者
实际上,对于一个新加载的dom,页面啥时候开始接受命令由页面的加载策略决定,也就是说,我们通过修改页面加载策略,可以使页面即使处于加载中,也能接受我们的命令,从这点可以解决webdriver.get的阻塞问题。而每类webdriver都有一个对应的配置文件放在特定的类DesiredCapabilities里面,通过修改里面的pageLoadStrategy,可以使webdriver的页面加载策略发生改变。
上面的代码用了最后一种解析方式——none
,不作等待,直接返回,然后在后面的代码中可以用explicit_wait
或者implicit_wait
等方式来对特定元素进行等待捕捉。
2、4种等待
UI自动化测试,大多都是通过定位页面元素来模拟实际的生产场景操作。但在编写自动化测试脚本中,经常出现元素定位不到的情况,究其原因,无非两种情况:1、有frame;2、没有设置等待。
因为代码运行速度和浏览器加载渲染速度,不是一个量级,所以导致了这种情况发生。webdriver提供了3种类型的等待:显式等待、隐式等待、强制等待。
2.1、强制等待
即sleep()方法,由python中的time模块提供,强制让代码等待xxx时间,无论前面的代码是否执行完成或者还未完成,都必须等待设定的时间。
不建议用这种等待方法,严重影响代码的执行速度。
示例代码如下:
1 # coding = utf-8 2 from selenium import webdriver 3 from time import sleep 4 5 driver = webdriver.Chrome("F:\安装工具\python\chromedriver.exe") 6 driver.get('http://www.cnblogs.com/imyalost/') 7 8 sleep(5) 9 10 print(driver.current_url) 11 driver.quit()
代码解析:
本例中,设置强制等待时间为5秒,5秒之后,打印获取到的当前页面的url,然后关闭窗口。
这种强制等待的方法,在debug时候很有用,不过建议慎用这种方法,因为太死板,严重影响程序执行速度!
2.2、隐式等待
隐式等待是设置全局的查找页面元素的等待时间,在这个时间内没找到指定元素则抛出异常,只需设置一次。
driver.manage().timeouts().implicitlyWait(10,TimeUnit.SECONDS);
所有的findElement方法都会隐式等待10s
2.3、显示等待
定义:等待某个条件成立时继续执行,否则在达到最大时长时抛出异常(TimeoutException);
1 WebDriverWait(driver,timeout,poll_frequency=0.5,ignored_exceptions=None) 2 driver:浏览器驱动 3 timeout:最长超时时间 4 poll_frequency:检测间隔时间,默认0.5s 5 ignored_exceptions:超时后的异常信息,默认情况抛出NoSuchElementException异常
6 WebDriverWait()一般由until()或until_not方法配合使用,下面是这两种方法的说明: 7 until(method,message=''):调用该方法提供的驱动程序作为一个参数,直到返回值为True; 8 until_not(method,message=''):调用该方法提供的驱动程序作为一个参数,直到返回值为Flase;
示例代码如下:
1 # coding = utf-8 2 from selenium import webdriver 3 from selenium.webdriver.support.wait import WebDriverWait 4 from selenium.webdriver.support import expected_conditions as EC 5 from selenium.webdriver.common.by import By 6 7 driver = webdriver.Chrome("F:\安装工具\python\chromedriver.exe") 8 driver.implicitly_wait(10) 9 driver.get('http://www.cnblogs.com/imyalost/') 10 locator = (By.LINK_TEXT, '老_张') 11 12 try: 13 WebDriverWait(driver, 20, 0.5).until(EC.presence_of_element_located(locator)) 14 print(driver.find_element_by_link_text('老_张').get_attribute('href')) 15 finally: 16 driver.close()
代码解析:
本例中,通过as关键字将expected_conditions重命名为EC,并调用presence_of_element_located()方法判断元素是否存在;
上面的例子中,同时使用了隐性等待和显性等待,但是需要注意的是:等待的最长时间取两者之中的最大值;
1 title_is: 判断当前页面的title是否完全等于(==)预期字符串,返回布尔值 2 title_contains : 判断当前页面的title是否包含预期字符串,返回布尔值 3 presence_of_element_located : 判断某个元素是否被加到了dom树里,并不代表该元素一定可见 4 visibility_of_element_located : 判断某个元素是否可见. 可见代表元素非隐藏,并且元素的宽和高都不等于0 5 visibility_of : 跟上面的方法做一样的事情,只是上面的方法要传入locator,这个方法直接传定位到的element就好了 6 presence_of_all_elements_located : 判断是否至少有1个元素存在于dom树中。举个例子,如果页面上有n个元素的class都是‘column-md-3‘,那么只要有1个元素存在,这个方法就返回True 7 text_to_be_present_in_element : 判断某个元素中的text是否 包含 了预期的字符串 8 text_to_be_present_in_element_value : 判断某个元素中的value属性是否 包含 了预期的字符串 9 frame_to_be_available_and_switch_to_it : 判断该frame是否可以switch进去,如果可以的话,返回True并且switch进去,否则返回False 10 invisibility_of_element_located : 判断某个元素中是否不存在于dom树或不可见 11 element_to_be_clickable : 判断某个元素中是否可见并且是enable的,这样的话才叫clickable 12 staleness_of : 等某个元素从dom树中移除,注意,这个方法也是返回True或False 13 element_to_be_selected : 判断某个元素是否被选中了,一般用在下拉列表 14 element_selection_state_to_be : 判断某个元素的选中状态是否符合预期 15 element_located_selection_state_to_be : 跟上面的方法作用一样,只是上面的方法传入定位到的element,而这个方法传入locator 16 alert_is_present : 判断页面上是否存在alert
2.4、流畅等待: FluentWait
与显示等待的 WebDriverWait类似,区别是WebDriverWait已经设置好几个等待条件,而流畅等待 FluentWait可以自己设置等待条件。
3、如何提高运行速度
设置等待时间的时候,少用sleep,尽量不用implicitly_wait,多用显式等待方法;
参考链接:
https://www.cnblogs.com/imyalost/p/7420924.html
https://www.cnblogs.com/qianjin100/p/9910699.html
https://blog.csdn.net/ouyanggengcheng/article/details/83036680