Selenium1.0与2.0介绍
Selenium的实现原理
首先,你要明确刚才建立的测试用例是基于Selenium 2.0,也就是Selenium + WebDriver的方案。
其次,你需要知道,对Selenium而言,V1.0和V2.0版本的技术方案是截然不同的,V1.0的核心 是Selenium RC,而V2.0的核心是WebDriver,可以说这完全是两个东西。
最后,Selenium 3.0也已经发布一段时间了,V3.0相比V2.0并没有本质上的变化,主要是增加了 对MacOS的Safari和Windows的Edge的支持,并彻底删除了对Selenium RC的支持。
所以接下来,我会针对V1.0和V2.0来解释Selenium实现Web自动化的原理。
第一,Selenium 1.0的工作原理
Selenium 1.0,又称Selenium RC,其中RC是Remote Control的缩写。Selenium RC利用的原理 是:JavaScript代码可以很方便地获取页面上的任何元素并执行各种操作。
但是因为"同源政策(Same-origin policy)"(只有来自相同域名、端口和协议的JavaScript代码才能被 浏览器执行),所以要想在测试用例运行中的浏览器中,注入JavaScript代码从而实现自动化的Web操 作,Selenium RC就必须“欺骗”被测站点,让它误以为被注入的代码是同源的。
那如何实现“欺骗”呢?这其实就是引入Selenium RC Server的根本原因,其中的Http Proxy模块就是用 来“欺骗”浏览器的。
除了Selenium RC Server,Selenium RC方案的另一大部分就是,Client Libraries。它们的具体关系如 图3所示。
图3 Selenium RC的基本模块
Selenium RC Server,主要包括Selenium Core,Http Proxy和Launcher三部分:
Selenium Core,是被注入到浏览器页面中的JavaScript函数集合,用来实现界面元素的识别和操 作; Http Proxy,作为代理服务器修改JavaScript的源,以达到“欺骗”被测站点的目的; Launcher,用来在启动测试浏览器时完成Selenium Core的注入和浏览器代理的设置。
Client Libraries,是测试用例代码向Selenium RC Server发送Http请求的接口,支持多种语言,包 括Java、C#和Ruby等。
为了帮你更好地理解Selenium RC的基本原理,我从Selenium的官方网站截取了以下执行流程图,并把 具体的7个步骤做了如下翻译。
图4 Selenium RC的执行流程
1. 测试用例通过基于不同语言的Client Libraries向Selenium RC Server发送Http请求,要求与其建立 连接。
2. 连接建立后,Selenium RC Server的Launcher就会启动浏览器或者重用之前已经打开的浏览器, 把Selenium Core(JavaScript函数的集合)加载到浏览器页面当中,并同时把浏览器的代理设置 为Http Proxy。
3. 测试用例通过Client Libraries向Selenium RC Server发送Http请求,Selenium RC Server解析请求, 然后通过Http Proxy发送JavaScript命令通知Selenium Core执行浏览器上控件的具体操作。
4. Selenium Core接收到指令后,执行操作。
5. 如果浏览器收到新的页面请求信息,则会发送Http请求来请求新的Web页面。由于Launcher在启动 浏览器时把Http Proxy设置成为了浏览器的代理,所以Selenium RC Server会接收到所有由它启动 的浏览器发送的请求。
6. Selenium RC Server接收到浏览器发送的Http请求后,重组Http请求以规避“同源策略”,然后获取 对应的Web页面。
7. Http Proxy把接收的Web页面返回给浏览器,浏览器对接收的页面进行渲染。
第二,Selenium 2.0的工作原理
接下来,我们回到上面那个百度搜索的测试用例,这个测试用例用的就是Selenium 2.0。Selenium 2.0,又称Selenium WebDriver,它利用的原理是:使用浏览器原生的WebDriver实现页面操作。它的 实现方式完全不同于Selenium 1.0。
Selenium WebDriver是典型的Server-Client模式,Server端就是Remote Server。以下是Selenium 2.0工作原理的解析。
图5 Selenium WebDriver的执行流程 1. 当使用Selenium2.0启动浏览器Web Browser时,后台会同时启动基于WebDriver Wire协议的Web Service作为Selenium的Remote Server,并将其与浏览器绑定。绑定完成后,Remote Server就开 始监听Client端的操作请求。
2. 执行测试时,测试用例会作为Client端,将需要执行的页面操作请求以Http Request的方式发送 给Remote Server。该HTTP Request的body,是以WebDriver Wire协议规定的JSON格式来描述需 要浏览器执行的具体操作。
3. Remote Server接收到请求后,会对请求进行解析,并将解析结果发给WebDriver,
由WebDriver实际执行浏览器的操作。
4. WebDriver可以看做是直接操作浏览器的原生组件(Native Component),所以搭建测试环境 时,通常都需要先下载浏览器对应的WebDriver。