selenium浏览器自动化测试框架文档（修正版）

写在最前面：目前自动化测试并不属于新鲜的事物，或者说自动化测试的各种方法论已经层出不穷，但是，能够在项目中持之以恒的实践自动化测试的团队，却依旧不是非常多。有的团队知道怎么做，做的还不够好；有的团队还正在探索和摸索怎么做，甚至还有一些多方面的技术上和非技术上的旧系统需要重构……
本文将会从使用和实践两个视角，尝试对基于Web UI自动化测试做细致的分析和解读，给各位去思考和实践做一点引路，以便各团队能找到更好的方式。
《论语》有云：工欲善其事，必先利其器。在开始具体的自动化测试之前，我们需要做好更多的准备，包括以下几个方面：

认识自动化测试
准备自动化测试工具
使用有效的方式
针对具体的测试对象接下来的第一部分内容，我们将会从上述的几个方面进行探讨。

1. 自动化测试理论介绍

1.1 自动化测试的5W

正如开篇所提到的，自动化测试不再是一个陌生的话题，而是一个具体的存在。作为测试实践活动的一部分，我们首先分析一下自动化测试的方方面面。

WHAT, 什么是自动化测试

G.J.Myers在其经典的著作《软件测试艺术》（The Art of Software Testing）一书中，给出了测试的定义：“程序测试是为了发现错误而执行的过程。”

这个概念产生于30年前，对软件测试的认识还非常有局限性，当然也是因为受瀑布开发模型的影响，认为软件测试是编程之后的一个阶段。只有等待代码开发出来以后，通过执行程序，像用户那样操作软件去发现问题。
自动化测试：以人为驱动的测试行为转化为机器执行的一种过程
自动化测试，就是把手工进行的测试过程，转变成机器自动执行的测试过程。该过程，依旧是为了发现错误而执行。因此自动化测试的关键在于“自动化”三个字。自动化测试的内容，也就相应的转变成如何“自动化”去实现原本手工进行的测试的过程。
所有的“自动化”，依靠的无疑都是程序。
通过程序，可以把手工测试，转变成自动化测试。

WHEN, 在什么时候开展自动化测试

　　自动化测试的开展，依赖于“程序”。那么程序，其实就是由“源代码”构建而来的。那么原则上，只要能做出自动化测试所需要的“程序”的时候，变可以进行自动化测试。但往往，并不是所有的“时候”都是好的“时机”。从这个W开始，我们将会加入对于成本的顾虑，也正是因为“成本”的存在，才使得下面的讨论，变得有意义。
　　所有的开销，都是有成本的。构建成“程序”的源代码，也是由工程师写出来的。那么需要考虑这个过程中的成本。基于这个考虑，在能够比较稳定的构建“程序”的时候，不需要花费太多开销在“源代码”的时候，就是开展自动化测试的好时机。这个开销包括编写和修改源代码，而源代码指的是构建出用来做自动化测试的程序的源代码。

WHERE, 在什么地方进行自动化测试

　　自动化测试的执行，依靠的是机器。那么自动化测试必将在“机器”上进行。一般来说，这个机器包括桌面电脑和服务器。通过将写好的源代码部署在机器上，构建出用来做自动化测试的"程序"，并且运行该程序，实现自动化测试。

WHICH, 对什么目标进行自动化测试

　　自动化测试的目标，是被测试的软件。抛开人工智能的成分，手工测试必将在“人工智能”足够普及和足够“智能”之前，替代一大部分不需要“人类智能”的手工测试；以及自动化测试会做一些手工测试无法实施的，或者手工测试无法覆盖的测试。不需要“人类智能”的普通手工测试：

界面的普通操作
通过固定输入和固定操作而进行的流程化测试
重复的普通测试
手工测试无法实施或者覆盖的
- 大量的数据的输入
- 大量的步骤的操作
- 源代码基本的测试
- 系统模块间接口的调用测试
- ……

HOW, 如何开展自动化测试

和所有的其他测试一样，自动化测试的流程也是由“用例”执行和“缺陷”验证组成。差别是需要找到合适的“工具”来替代“人手”。不同目标的自动化测试有不同的测试工具，但是任何工具都无不例外的需要“编程”的过程，实现“源代码”，也可以称之为测试脚本。于是开展自动化测试的方式基本上如下：

- 　　准备测试用例
- 　　找到合适的自动化测试工具
- 　　用准确的编程形成测试脚本
- 　　在测试脚本中对目标进行“检查”，即做断言
- 　　记录测试日志，生成测试结果

2. 自动化测试的典型金字塔原理

谈到自动化测试，就不得不提的一个人和概念就是：Martin Fowler和他的金字塔原理。首先请看金字塔原理的图示如下：

该图说明了三个问题：

自动化测试包括三个方面：UI前端界面，Service服务契约和Unit底层单元
越是底层的测试，运行速度越快，时间开销越少，金钱开销越少
越是顶层的测试，运行速度越慢，时间开销越多，金钱开销越多

这是理想中的金字塔原理。
在实际的项目中，尤其是结合国内的项目实践，其实还隐藏了另一个问题：越是顶层的测试，效果越明显。有句话说“贵的东西，除了贵，其他都是好的！”能够很清晰的阐述这个观点。
金字塔原理在国内的适应性也有一定的问题

自动化测试的起步不是特别早
甚至软件测试很长一段时间都在进行基于业务的手工测试，测试人员的代码能力相对较弱
开发人员在代码中不太习惯写单元测试
近些年基于服务契约的API测试也在兴起

相对来说，在基于UI前端界面的自动化测试反倒是开展和实施的不是特别多。尽管基于界面的测试带来的效果还是能够立竿见影的。对于产品的质量提升，还是比较容易有保证。

自动化测试的适用范围

自动化测试可以涉及和试用的范围主要在以下方面：

基于Web UI的浏览器应用的界面测试
基于WebService或者WebAPI的服务契约测试
基于WCF、.net remoting、Spring等框架的服务的集成测试
基于APP UI的移动应用界面测试
基于Java、C#等编程文件进行的单元测试

本文集中讨论第一条：基于Web UI的浏览器应用的界面测试。界面的改动对于测试来说，具有较大的成本风险。主要考虑以下方面：

任务测试明确，不会频繁变动
每日构建后的测试验证
比较频繁的回归测试
软件系统界面稳定，变动少
需要在多平台上运行的相同测试案例、组合遍历型的测试、大量的重复任务
软件维护周期长
项目进度压力不太大
被测软件系统开发比较规范，能够保证系统的可测试性
具备大量的自动化测试平台
测试人员具备较强的编程能力

自动化测试的流程

自动化测试和普通的手工测试遵循的测试流程，与项目的具体实践相关。一般来说，也是需要从测试计划开始涉及自动化测试的。

测试计划：划定自动化测试的范围包含哪些需求，涉及到哪些测试过程
测试策略：确定自动化测试的工具、编程方案、代码管理、测试重点
测试设计：使用测试设计方法对被测试的需求进行设计，得出测试的测试点、用例思维导图等
测试实施：根据测试设计进行用例编写，并且将测试用例用编程的方式实现测试脚本
测试执行：执行测试用例，运行测试脚本，生成测试结果

3. 自动化测试工具
基于Web UI的自动化测试工具主要有两大类：付费的商业版工具和免费使用的开源版工具。典型的有两种：

UFT，QTP被惠普收购以后的新名称。

通过程序的录制，可以实现测试的编辑
录制的测试脚本是 VBScript 语法
成熟版的商业付费工具
工具比较庞大，对具体的项目定制测试有难度

SELENIUM，本次选择的开源工具

本身不是测试工具，只是模拟浏览器操作的工具
背后有 Google 维护源代码
支持全部主流的浏览器
支持主流的编程语言，包括：Java、Python、C#、PHP、Ruby、JavaScript等
工具很小，可以实现对测试项目的定制测试方案
基于标准的 WebDriver 语法规范

3.1 Selenium 基本介绍
Selenium`是开源的自动化测试工具，它主要是用于Web 应用程序的自动化测试，不只局限于此，同时支持所有基于web 的管理任务自动化。

Selenium官网的介绍

Selenium is a suite of tools to automate web browsers across many platforms.

runs in many browsers and operating systems
can be controlled by many programming languages and testing frameworks.

Selenium 官网：http://seleniumhq.org/
Selenium Github 主页：https://github.com/SeleniumHQ/selenium

Selenium 是用于测试 Web 应用程序用户界面 (UI) 的常用框架。它是一款用于运行端到端功能测试的超强工具。您可以使用多个编程语言编写测试，并且 Selenium 能够在一个或多个浏览器中执行这些测试。

Selenium 经历了三个版本：Selenium 1，Selenium 2 和 Selenium 3。Selenium 也不是简单一个工具，而是由几个工具组成，每个工具都有其特点和应用场景。

Selenium 诞生于 2004 年，当在 ThoughtWorks 工作的 Jason Huggins 在测试一个内部应用时。作为一个聪明的家伙，他意识到相对于每次改动都需要手工进行测试，他的时间应该用得更有价值。他开发了一个可以驱动页面进行交互的 Javascript 库，能让多浏览器自动返回测试结果。那个库最终变成了 Selenium 的核心，它是 Selenium RC（远程控制）和 Selenium IDE 所有功能的基础。Selenium RC 是开拓性的，因为没有其他产品能让你使用自己喜欢的语言来控制浏览器。这就是 Selenium 1。

然而，由于它使用了基于 Javascript 的自动化引擎，而浏览器对 Javascript 又有很多安全限制，有些事情就难以实现。更糟糕的是，网站应用正变得越来越强大，它们使用了新浏览器提供的各种特性，都使得这些限制让人痛苦不堪。

在 2006 年，一名 Google 的工程师， Simon Stewart 开始基于这个项目进行开发，这个项目被命名为 WebDriver。此时，Google 早已是 Selenium 的重度用户，但是测试工程师们不得不绕过它的限制进行工具。Simon 需要一款能通过浏览器和操作系统的本地方法直接和浏览器进行通话的测试工具，来解决Javascript 环境沙箱的问题。WebDriver 项目的目标就是要解决 Selenium 的痛点。

到了 2008 年，Selenium 和 WebDriver 两个项目合并。Selenium 有着丰富的社区和商业支持，但 WebDriver 显然代表着未来的趋势。两者的合并为所有用户提供了一组通用功能，并且借鉴了一些测试自动化领域最闪光的思想。这就是 Selenium 2。

2016 年，Selenium 3 诞生。移除了不再使用的 Selenium 1 中的 Selenium RC，并且官方重写了所有的浏览器驱动。

Selenium 工具集

Selenium IDE

Selenium IDE (集成开发环境) 是一个创建测试脚本的原型工具。它是一个 Firefox 插件，实现简单的浏览器操作的录制与回放功能，提供创建自动化测试的建议接口。Selenium IDE 有一个记录功能，能记录用户的操作，并且能选择多种语言把它们导出到一个可重用的脚本中用于后续执行。

Selenium RC

Selenium RC 是selenium 家族的核心工具，Selenium RC 支持多种不同的语言编写自动化测试脚本，通过selenium RC 的服务器作为代理服务器去访问应用从而达到测试的目的。
selenium RC 使用分Client Libraries 和Selenium Server。

Client Libraries 库主要主要用于编写测试脚本，用来控制selenium Server 的库。
Selenium Server 负责控制浏览器行为，总的来说，Selenium Server 主要包括3 个部分：Launcher、Http Proxy、Core。

Selenium Grid

Selenium Grid 使得 Selenium RC 解决方案能提升针对大型的测试套件或者哪些需要运行在多环境的测试套件的处理能力。Selenium Grid 能让你并行的运行你的测试，也就是说，不同的测试可以同时跑在不同的远程机器上。这样做有两个有事，首先，如果你有一个大型的测试套件，或者一个跑的很慢的测试套件，你可以使用 Selenium Grid 将你的测试套件划分成几份同时在几个不同的机器上运行，这样能显著的提升它的性能。同时，如果你必须在多环境中运行你的测试套件，你可以获得多个远程机器的支持，它们将同时运行你的测试套件。在每种情况下，Selenium Grid 都能通过并行处理显著地缩短你的测试套件的处理时间。

Selenium WebDriver

WebDriver 是 Selenium 2 主推的工具，事实上WebDriver是Selenium RC的替代品，因为Selenium需要保留向下兼容性的原因，在 Selenium 2 中， Selenium RC才没有被彻底的抛弃，如果使用Selenium开发一个新的自动化测试项目，那么我们强烈推荐使用Selenium2 的 WebDriver进行编码。另外，在Selenium 3 中，Selenium RC 被移除了。

Python 语言的选择，便捷

测试人员的编程能力普遍不是很强，而Python作为一种脚本语言，不仅功能强大，而且语法优美，支持多种自动化测试工具，而且学习上手比较容易。
Python的社区发展比较好，有着非常多的文档和支持库，另外Python也可以在Web开发、数据处理、科学计算等纵多领域有着非常好的应用前景。
对于有一定编程基础的人员，使用Python作为自动化测试的语言可以非常顺畅的转换，几乎没有学习成本。同时Python是标准的面向对象的编程语言，对于C#、Java等面向对象的语言有着非常好的示例作用，通过Python的示例可以非常轻松的触类旁通，使用其他语言进行Selenium2.0的WebDriver的使用。
读音：/'paɪθən/
Python的创始人为Guido Van Rossum。1989年圣诞节期间，在阿姆斯特丹，Guido为了打发圣诞节的无趣，决心开发一个新的脚本解释程序，做为ABC 语言的一种继承。之所以选中Python（大蟒蛇的意思）作为程序的名字，是因为他是一个叫Monty Python的喜剧团体的爱好者。
Python 语言除了在自动化测试领域有出色的表现外，在系统编程，网络编程，web 开发，GUI开发，科学计算，游戏开发等多个领域应用非常广泛，而且具有非常良好的社区支持。也就是说学习和掌握python 编程，其实是为你打开了一道更广阔的大门。

使用的工具集

IDE: Jetbrains PyCharm
语言: Python
工具: Selenium WebDriver
源代码管理: SVN/Git

3.2 JetBrains PyCharm 使用

JetBrains PyCharm 的介绍

PyCharm 是 JetBrains 公司针对Python推出的IDE（Integrated Development Environment，集成开发环境）。是目前最好的Python IDE之一。目前包含了两个版本：

社区版，Community Edition
专业版，Professional Edition

付费
比社区版主要多了Web开发框架

我们推荐使用免费的社区版本，进行Python脚本的编写和自动化测试执行。
PyCharm可以在官网下载，http://www.jetbrains.com
PyCharm 安装后，如果也安装过 Python 环境，可以直接进行操作。否则请在 1.2.3 中安装好 Python，再使用 PyCharm。

安装按照默认的步骤安装

使用方式

Create New Project：

创建新的项目，选择项目创建的位置，选择Python的解释器

设置location，项目的路径和名称
名称必须以英文字母开头
名称不可以有空格
位置不可以在 C:\Pytho34中，应该放到普通的目录中

设置interpreter
一个电脑可以装多个 Python
这里选择一个你需要的 Pythpn

新建Python文件

在创建的文件中编写第一个Python语句
print("hello Python!")

右键该文件，选择Run hello，运行该语句，在下面的运行框中会显示运行结果
C:\Python35\python.exe D:/Git/WeekendSelenium/untitled/hello.py hello python! Process finished with exit code 0
如图

Open

打开已经存在的项目，比如别人发给你的项目，或者已经创建过的项目

安装后进行设置如下：

设置行号的显示

在PyCharm 里，显示行号有两种办法：

临时设置(不推荐)。右键单击行号处，选择 Show Line Numbers。

但是这种方法，只对一个文件有效，并且，重启PyCharm 后消失。

永久设置。File --> Settings -->Editor -->Appearance , 之后勾选Show Line Numbers。

设置字体

选择 Settings | Editor | Colors & Fonts | Fonts
Save AS 主题
选择 Source Code Pro（建议选择，等宽字体）

SVN / Git 在工具中的集成

源代码管理工具（VCS, version control system)
如果TortoiseSVN版本低于 1.8，需要先升级安装1.8以上的版本
选择SVN(git)作为代码的源代码管理工具。集成在PyCharm中的步骤如下

代码已经存在在SVN repo中：把代码放到SVN在本地签出（check out）的文件夹目录中，例如 D:\SVN\XXProject\Trunck

代码没有创建：在本地的SVN项目文件夹中新建项目，用PyCharm打开，提交。

用PyCharm打开刚刚部署的代码
选择PyCharm的 VCS|Enable VCS integration，选择 Subversion（svn）或者 Git

右键项目文件的根目录，选择 Subversion | add to VCS

右键项目文件的根目录，或者选 VCS | Commit Directory...

每天打开代码后，右键项目文件的根目录，首先 Subversion | update project
如果有冲突，先本地手工保存你做的修改（备份你的文件到其他地方，SVN目录之外的地方，然后Revert）

3.3 Selenium 的环境搭建

在 Windows 搭建和部署 Selenium 工具

主要包括两个步骤：

安装 Python 语言

Python的官方网站：http://www.python.org
Python 目前并行了两套版本，2.x 和 3.x。如果你之前没有 Python 的使用经验，建议使用 Python 3.x 版本。两套版本互相不兼容，并且 Python 从 3.5（含）开始，不再支持 Windows XP 系统，请注意。

3.4或者3.4以下的版本，都是 C:\python34
3.5以上的目录，默认装个人文件夹，建议用类似上面的目录，比如C:\python35

勾选添加环境变量

勾选Add Python.exe to PATH

安装过程中不要关闭弹出来的命令行窗口
关于 Python 的安装，也可以选择一些第三方的Python 安装包，典型的有 Anaconda3，这样的包有丰富的第三方库，在使用 Python 的过程中会更加方便。

Anaconda 的官网：https://www.continuum.io/anaconda-overview

安装 Selenium 工具包

由于安装好的 Python 默认有 pip Python 包管理工具，可以通过 pip 非常方便的安装 Selenium。

启动命令行工具：Win+R | 输入 cmd | 回车
输入命令：

pip install selenium
该命令的执行需要有互联网联网环境。此外该命令有以下几种选项可以使用

安装指定的版本，例如安装指定的 Selenium 3.4.3

pip install selenium==3.4.3

安装最新版的 Selenium

pip install -U selenium # -U 也可以用 --upgrade pip install --upgrade selenium

卸载安装当前的 Selenium

pip uninstall selenium

当然，如果您的机器处于非接入互联网的环境，您可以事先下载 Selenium 的 Python 安装包，再进行手动安装。

官方下载地址：https://pypi.python.org/pypi/selenium
上述地址会下载最新版的 Selenium，目前最先版的是 3.4.3，您也可以根据以下路径下载指定的 3.4.3
Selenium 3.4.3 下载地址：https://pypi.python.org/pypi/selenium/3.4.3#downloads
下载后，解压该压缩包
然后用命令行进入该压缩包的根目录，输入命令进行安装

python setup.py install

配置浏览器和驱动

Selenium 2 可以默认支持Firefox 46.0或者更低版本，对于其他浏览器需要额外安装驱动。
Selenium 3 对于所有的浏览器都需要安装驱动，本文以 Chrome 和 Firefox、IE为例设置浏览器和驱动。

ChromeDriver下载地址：http://chromedriver.storage.googleapis.com/index.html
ChromeDriver 与 Chrome 对应关系表：

ChromeDriver版本支持的Chrome版本v2.31v58-60v2.30v58-60v2.29v56-58v2.28v55-57v2.27v54-56v2.26v53-55v2.25v53-55v2.24v52-54v2.23v51-53v2.22v49-52v2.21v46-50v2.20v43-48

GeckoDriver下载地址：https://github.com/mozilla/geckodriver/releases
GeckoDriver 与 Firefox 的对应关系表：

GeckoDriver版本支持的Firefox版本v0.18.0v56v0.17.0v55v0.16.0v54，需要Selenium 3.4或者以上v0.15.0v53，需要Selenium 3.3或者以上

IEDriverServer下载地址：http://selenium-release.storage.googleapis.com/index.html
IEDriverServer 的版本需要与 Selenium 保持严格一致。

浏览器驱动的配置

首先，将下载好的对应版本的浏览器安装。
其次，在 Python 的根目录中，放入浏览器驱动。
最好再重启电脑，一般情况下不重启也可以的。

4. Selenium 的最简脚本
通过上一节的环境安装成功以后，我们可以进行第一个对Selenium 的使用，就是最简脚本编写。脚本如下：

实际上一段20行的代码，也不能算太少了。但是这段代码的使用，确实体现了 Selenium 的最简单的使用。我们在下面内容进行阐述。

关于面向对象编程

通过前面的介绍，我们知道 Selenium 支持多种语言，并且推荐使用面向对象的方式进行编程。接下来我们将着重介绍如何使用面向对象的方式进行编程。
我们利用 Python 进行面向对象编程，需要首先了解一个概念：类

类是任何面向对象编程的语言的基本组成，描述了使用的基本方法。我们可能在目前，还不是特别明白类的含义，但是我们可以通过类的使用，来进一步了解。

类的使用

类，通过实例化进行使用。比如有一个类: Driver，该类有一个方法: head(road)
那么关于这个类的使用，只需要两个步骤：

实例化该类：d = Driver()
调用类的方法：d.head("中山路")

了解上述例子和使用以后，我们来看具体的 Selenium 的使用。

具体的对象的使用

在面向对象的理念看来，任何的编码，都是由对象而来的，这里也不例外。和之前介绍 WebDriver 时候的描述对应，我们需要用到两种主要的类，并将其实例化。

WebDriver 类：主要靠直接实例化该类为对象，然后用其对象直接调用该类的方法和属性
WebElement 类：主要通过 WebDriver 类实例化的对象，通过对页面元素的查找，得到 WebElement 类的对象，然后调用该类的方法和属性。

上述代码中，使用了一个 WebDriver 类的对象，即第2行，声明了该类的对象，并赋值给变量 driver，接着变量 driver 作为 WebDriver 类的对象，使用了多个 WebDriver 类的方法。
注意：Chrome 是 WebDriver 的子类，是 WebDriver 类的一种

get(url): 第5行，打开网址
find_element_by_css_selector(selector): 第12、17、22行都使用了该方法，同时通过对该方法的调用，分别各产生了一个 WebElement类的对象，we_account，we_password和最后一个匿名的对象，并通过产生的三个对象，调用 WebElement 类的方法

clear()：清理页面元素中的文字
send_keys(text)：给页面元素中，输入新的文字
click()：鼠标左键点击页面元素

正是通过这样的面向对象的方式，产生 Web司机（WebDriver类的对象），并且通过 Web司机不懈的努力，寻找到各种 Web元素（WebElement类的对象）进行操作，这样便实现了 Selenium WebDriver 作为一款出色的浏览器测试工具，进行浏览器UI界面的自动化测试的代码编写和用例执行。

5. Selenium WebDriver API 的使用
通过上述最简脚本的使用，我们可以来进一步了解 Selenium 的使用。事实上，上一节用的，便是 Selenium 的 WebDriver API。API（Application Programming Interface，应用程序编程接口，即通过编程语言，操作 WebDriver 的方法集合）

Selenium WebDriver API 官方参考：http://seleniumhq.github.io/selenium/docs/api/py/
具体API文档地址：https://seleniumhq.github.io/selenium/docs/api/py/api.html

API 使用：用现成的类（大部分情况）的方法进行编程

WebDriver
WebElement

API 文档

编程使用说明
介绍了每个方法的使用

方法的作用
方法的参数
方法的返回值

5.1 控制浏览器
浏览器的控制也是自动化测试的一个基本组成部分，我们可以将浏览器最大化，设置浏览器的高度和宽度以及对浏览器进行导航操作等。

5.2 元素定位操作
WebDriver提供了一系列的定位符以便使用元素定位方法。常见的定位符有以下几种：

id
name
class name
tag
link text
partial link text
xpath
css selector

那么我们以下的操作将会基于上述的定位符进行定位操作。
对于元素的定位，WebDriver API可以通过定位简单的元素和一组元素来操作。在这里，我们需要告诉Selenium如何去找元素，以至于他可以充分的模拟用户行为，或者通过查看元素的属性和状态，以便我们执行一系列的检查。
在Selenium2中，WebDriver提供了多种多样的find_element_by方法在一个网页里面查找元素。这些方法通过提供过滤标准来定位元素。当然WebDriver也提供了同样多种多样的find_elements_by的方式去定位多个元素。
尽管上述的方式，可以进行元素定位，实际上我们也是更多的用组合的方式进行元素定位。

接下来的列表将会详细展示find_elements_by的方法集合。这些方法依据匹配的具体标准返回一系列的元素。（注意区别是element和elements）

5.2.1 依据ID查找
请查看如下HTML的代码，以便实现通过ID的属性值去定义一个查找文本框的查找：

根据上述代码，这里我们使用find_element_by_id()的方法去查找搜索框并且检查它的最大长度maxlength属性。我们通过传递ID的属性值作为参数去查找，参考如下的代码示例：

如果使用find_elements_by_id()方法，将会返回所有的具有相同ID属性值的一系列元素。

5.2.2 依据名称name查找
这里还是根据上述ID查找的HTML代码，使用find_element_by_name的方法进行查找。参考如下的代码示例：

同样，如果使用find_elements_by_name()方法，将会返回所有的具有相同name属性值的一系列元素。

5.2.3 依据class name查找
除了上述的ID和name的方式查找，我们还可以使用class name的方式进行查找和定位。
事实上，通过ID，name或者类名class name查找元素是最提倡推荐的和最快的方式。当然Selenium2 WebDriver也提供了一些其他的方式，在上述三类方式条件不足，查找无效的时候，可以通过这些其他方式来查找。这些方式将会在后续的内容中讲述。
请查看如下的HTML代码，通过改代码进行练习和理解。

根据上述代码，使用find_element_by_class_name()方法去定位元素。

同样的如果使用find_elements_by_class_name()方法去定位元素，将会返回所有的具有相同name属性值的一系列元素。

5.2.4 依据标签名tag name查找
利用标签的方法类似于利用类名等方法进行查找。我们可以轻松的查找出一系列的具有相同标签名的元素。例如我们可以通过查找表中的<tr>来获取行数。
下面有一个HTML的示例，这里在无序列表中使用了<img>标签。

这里面我们使用find_elements_by_tag_name()的方式去获取全部的图片，在此之前，我们将会使用find_element_by_class_name()去获取到指定的<ul>。
具体代码如下：

5.2.5依据链接文字link查找
链接文字查找通常比较简单。使用find_element_by_link_text请查看以下示例

测试代码如下：

5.2.6依据部分链接文字partial text查找
这里依旧使用上述的列子进行代码编写：

5.2.7依据XPath进行查找

XPath是一种在XML文档中搜索和定位节点node的一种查询语言。所有的主流Web浏览器都支持XPath。Selenium2可以用强大的XPath在页面中查找元素。

常用的XPath的方法有starts-with()，contains()和ends-with()等

若想要了解更多关于XPath的内容，请查看http://www.w3schools.com/XPath/

如下有一段HTML代码，其中里面的<img>没有使用ID，name或者类属性，所以我们无法使用之前的方法。亚这里我们可以通过<img>的alt属性，定位到指定的tag。

 1 <ul class="promos">
 2     <li>
 3         <a href="http://demo.magentocommerce.com/home-decor.html">
 4             <img src="/media/wysiwyg/homepage-three-column-promo-
 5         01B.png" alt="Physical &amp; Virtual Gift Cards">
 6         </a>
 7     </li>
 8     <li>
 9         <a href="http://demo.magentocommerce.com/vip.html">
10             <img src="/media/wysiwyg/homepage-three-column-promo-
11         02.png" alt="Shop Private Sales - Members Only">
12         </a>
13     </li>
14     <li>
15         <a href="http://demo.magentocommerce.com/accessories/
16         bags-luggage.html">
17             <img src="/media/wysiwyg/homepage-three-columnpromo-
18         03.png" alt="Travel Gear for Every Occasion">
19         </a>
20     </li>
21 </ul>

具体代码如下：

 1 def test_vip_promo(self):
 2     # get vip promo image
 3     vip_promo = self.driver.\
 4     find_element_by_xpath("//img[@alt='Shop Private Sales - Members Only']")
 5     # check vip promo logo is displayed on home page
 6     self.assertTrue(vip_promo.is_displayed())
 7     # click on vip promo images to open the page
 8     vip_promo.click()
 9     # check page title
10     self.assertEqual("VIP", self.driver.title)

当然，如果使用find_elements_by_xpath()的方法，将会返回所有匹配了XPath查询的元素。

5.2.8 依据CSS选择器进行查找

CSS是一种设计师用来描绘HTML文档的视觉的层叠样式表。一般来说CSS用来定位多种多样的风格，同时可以用来是同样的标签使用同样的风格等。类似于XPath，Selenium2也可以使用CSS选择器来定位元素。

请查看如下的HTML文档。

<div class="minicart-wrapper">
    <p class="block-subtitle">Recently added item(s)
        <a class="close skip-link-close" href="#" title="Close">×</a>
    </p>
    <p class="empty">You have no items in your shopping cart.
    </p>
</div>

我们来创建一个测试，验证这些消息是否正确。

def test_shopping_cart_status(self):
    # check content of My Shopping Cart block on Home page
    # get the Shopping cart icon and click to open the
    # Shopping Cart section
    shopping_cart_icon = self.driver.\
    find_element_by_css_selector("div.header-minicart
                                 span.icon")
    shopping_cart_icon.click()
    # get the shopping cart status
    shopping_cart_status = self.driver.\
    find_element_by_css_selector("p.empty").text
    self.assertEqual("You have no items in your shopping cart.",
    shopping_cart_status)
    # close the shopping cart section
    close_button = self.driver.\
    find_element_by_css_selector("div.minicart-wrapper
                                 a.close")
    close_button.click()

特殊 iframe 操作

iframe 元素会创建包含另外一个文档的内联框架（即行内框架）。

iframe：紫禁城

在一个<html>中，包含了另一个<html>

示例

<html>
  <head>
    <title>iframe示例</title>
  </head>
  <body>
    <h1>
      这里是H1，标记了标题
    </h1>
    <p>
      这里是段落，标记一个段落，属于外层
    </p>
    <div>
      <iframe id="iframe-1">
        <html>
          <body>
            <p>
              这里是个段落，属于内层，内联框架中的
            </p>
            <div id="div-1">
              <p class="hahahp">
                这里是div中的段落，需要被定位
              </p>
            </div>
          </body>
        </html>
      </iframe>
    </div>
  </body>
</html>

需要定位上面示例中的<p>:这里是div中的段落，需要被定位

如下是selenium WebDiriver的代码

<select> 是选择列表

Select 是个selenium的类selenium.webdriver.support.select.Select

Select 类的路径：

C:\Python35\Lib\site-packages\selenium\webdriver\support\select.py

<select id="brand">
  <option value ="volvo">Volvo</option>
  <option value ="saab">Saab</option>
  <option value="opel">Opel</option>
  <option value="audi">Audi</option>
</select>

示例，选择 Audi

## 查找并定位到 select
element_select = driver.find_element_by_css_selector('#brand')
## 用Select类的构造方法，实例化一个对象 object_select
object_select = Select(element_select)
## 操作 object_select
object_select.select_by_index(3)
##　也可以这样
object_select.select_by_value('audi')
##　还可以这样
object_select.select_by_visible_text('Audi')

组合操作

自动化经验的积累，需要100%按照手工的步骤进行操作。

比如步骤如下：

点击一个 <a id="customer_chosen">
自动产生了一个 <ul id="customer_list">
点击<ul>的第五个<li>

代码示例

driver.find_element_by_css_selector('#customer_chosen').click()
sleep(1)
driver.find_element_by_css_selector('#customer_list > li:nth-child(5)')

5.3 鼠标事件操作

Web测试中，有关鼠标的操作，不只是单击，有时候还要做右击、双击、拖动等操作。这些操作包含在ActionChains类中。

常用的鼠标方法：

context_click() # 右击
double_click() # 双击
drag_and_drop() # 拖拽
move_to_element() # 鼠标停在一个元素上
click_and_hold() # 按下鼠标左键在一个元素上

例子：

 1 # 方法模拟鼠标右键，参考代码如下：
 2 # 引入ActionChains 类
 3 from selenium.webdriver.common.action_chains import ActionChains
 4 ...
 5 # 定位到要右击的元素
 6 right =driver.find_element_by_xpath("xx")
 7 # 对定位到的元素执行鼠标右键操作
 8 ActionChains(driver).context_click(right).perform()
 9 ...
10 # 定位到要双击的元素
11 double = driver.find_element_by_xpath("xxx")
12 # 对定位到的元素执行鼠标双击操作
13 ActionChains(driver).double_click(double).perform()

5.4 键盘事件操作

键盘操作经常处理的如下：

代码如下

 1 from selenium import webdriver
 2  
 3 # 引入Keys 类包
 4 from selenium.webdriver.common.keys import Keys
 5 import time
 6  
 7 driver = webdriver.Chrome()
 8 driver.get("http://www.baidu.com")
 9  
10 # 输入框输入内容
11 driver.find_element_by_id("kw").send_keys("selenium")
12 time.sleep(3)
13  
14 # 删除多输入的一个m
15 driver.find_element_by_id("kw").send_keys(Keys.BACK_SPACE)
16 time.sleep(3)
17  
18 # 输入空格键+“教程”
19 driver.find_element_by_id("kw").send_keys(Keys.SPACE)
20 driver.find_element_by_id("kw").send_keys("教程")
21 time.sleep(3)
22  
23 # ctrl+a 全选输入框内容
24 driver.find_element_by_id("kw").send_keys(Keys.CONTROL,'a')

5.5 截图操作

截图的方法：save_screenshot(file)

6. unittest 单元测试框

在上一节，我们对 Selenium WebDriver 的使用，仅仅停留在让网页自动的进行操作的阶段，并没有对任何一个步骤进行“检查”。当然，这样没有“检查”的操作，实际上是没有测试意义的。那么第一项，我们需要解决的便是“检查”的问题。

所谓“检查”，实际上就是断言。对需要检查的步骤操作，通过对预先设置的期望值，和执行结果的实际值之间的对比，得到测试的结果。在这里，我们并不需要单独的写 if 语句进行各种判定，而是可以使用编程语言中对应的单元测试框架，即可解决好此类问题。

目前 Java 语言主流的单元测试框架有 JUnit 和 TestNG。Python 语言主流的单元测试框架有 unittest 。本小节的内容，主要介绍 unittest 的使用，探讨单元测试框架如何帮助自动化测试。

接下来我们将会使用 Python 语言的unittest框架展开“检查”。unittest框架的原本的名字是PyUnit。是从JUnit 这样一个被广泛使用的经典的Java应用开发的单元测试框架创造而来。类似的框架还有NUnit（.Net开发的单元测试框架）等。我们可以使用unittest框架为任意Python项目编写可理解的单元测试集合。现在这个unittest已经作为Python的标准库模块发布。我们安装完Python以后，便可以直接使用unittest。

使用unittest需要以下简单的三步：

引入unittest模组
继承unittest.TestCase基类
测试方法以test开头

unittest 并未使用 Java 语言常见的注解方式，依旧停留在比较早期的 Java 版本中依靠方法名称进行识别的方式。主要有以下两个固定名字的方法：

setUp()：在每个测试方法运行前，执行。是测试前置条件。
tearDown()：在每个测试方法运行后执行，是测试清理操作。

具体的代码如下：

 1 ## 引入unittest模组
 2 import unittest
 3  
 4 ## 定义测试类，名字为DemoTests
 5 ## 该类必须继承unittest.TestCase基类
 6 class DemoTests(unittest.TestCase):
 7  
 8     ## 使用'@'修饰符，注明该方法是类的方法
 9     ## setUpClass方法是在执行测试之前需要先调用的方法
10     ## 是开始测试前的初始化工作
11     @classmethod
12     def setUpClass(cls):
13         print("call setUpClass()")
14     
15     ## 每一个测试开始前的预置条件
16     def setUp(self):
17         print("call setUp()")
18         
19     ## 每一个测试结束以后的清理工作
20     def tearDown(self):
21         print("call tearDown()")
22  
23     ## 测试一（务必以test开头）
24     def test_01(self):
25         print("call test_01()")
26         pass
27  
28     ## 测试三（务必以test开头）
29     def test_02(self):
30         print("call test_02()")
31         pass
32  
33     ## 测试三（务必以test开头）
34     def test_03(self):
35         print("call test_03()")
36         pass
37  
38     ## tearDownClass方法是执行完所有测试后调用的方法
39     ## 是测试结束后的清除工作
40     @classmethod
41     def tearDownClass(cls):
42         print("call tearDownClass()")
43  
44 # 执行测试主函数
45 if __name__ == '__main__':
46     ## 执行main全局方法，将会执行上述所有以test开头的测试方法
47     unittest.main(verbosity=2)

需要注意步骤：

引入 unittest 模组
继承 unittest.TestCase 类
做测试用例的方法，方法以 test_ 开头
附加 setUp(), tearDown(), 在每个 test_ 方法执行前后进行执行
附加 setUpClass(), tearDownClass()，需要在类实例化的对象，运行的开头和结尾进行执行。

上述代码运行结果如下：

 1 call setUpClass()
 2 call setUp()
 3 call test_01()
 4 call tearDown()
 5 call setUp()
 6 call test_02()
 7 call tearDown()
 8 call setUp()
 9 call test_06()
10 call tearDown()
11 call tearDownClass()

为什么选择 unittest

清晰的单元测试框架，提供 TestCase, TestSuite, TextTestRunner 等基本类
unittest 是原生 Python 的一部分
unittest 有第三方可用的 HTML 库，可以轻松的生成测试报告

unittest 的断言配置使用，unittest 的断言，属于 TestCase类，只要继承了该类，均可以通过 self调用断言

7. 为什么需要封装 Selenium

什么是封装

　　封装是一个面向对象编程的概念，是面向对象编程的核心属性，通过将代码内部实现进行密封和包装，从而简化编程。对Selenium进行封装的好处主要有如下三个方面：

使用成本低

不需要要求所有的测试工程师会熟练使用Selenium，而只需要会使用封装以后的代码
不需要对所有的测试工程师进行完整培训。也避免工作交接的成本。
测试人员使用统一的代码库

维护成本低

通过封装，在代码发生大范围变化和迁移的时候，不需要维护所有代码，只需要变更封装的部分即可
维护代码不需要有大量的工程师，只需要有核心的工程师进行封装的维护即可

代码安全性

对作为第三方的Selenium进行封装，是代码安全的基础。
对于任何的代码的安全隐患，必须由封装来解决，使得风险可控。
使用者并不知道封装内部的代码结构。

8. 封装的概念与基本操作

8.1 关键方法的封装思路

封装的具体示例：

找到一个指定输入框(selector)，并且输入指定的字符(text)

type(selector, text)

不用在业务逻辑中，使用多次的 find_element_by_id(...))

def type(self, selector, text):
    """
    Operation input box.
    Usage:
    driver.type("i,el","selenium")
    """
    el = self._locate_element(selector)
    el.clear()
    el.send_keys(text)

找到一个可以点击的元素(selector)，并且点击(click)

　　 click(selector)

1 def click(self, selector):
2     """
3     It can click any text / image can be clicked
4     Connection, check box, radio buttons, and even drop-down box etc..
5     Usage:
6     driver.click("i,el")
7     """
8     el = self._locate_element(selector)
9     el.click()

找到一个指定的frame，并且切换进去

　　 switch_to_frame(selector)

1 def switch_to_frame(self, selector):
2     """
3     Switch to the specified frame.
4     Usage:
5     driver.switch_to_frame("i,el")
6     """
7     el = self._locate_element(selector)
8     self.base_driver.switch_to.frame(el)

找到一个指定的select，并且通过index进行选择

　　 select_by_index(selector, index)

1 def select_by_index(self, selector, index):
2     """
3     It can click any text / image can be clicked
4     Connection, check box, radio buttons, and even drop-down box etc..
5     Usage:
6     driver.select_by_index("i,el")
7     """
8     el = self._locate_element(selector)
9     Select(el).select_by_index(index)

以上的代码是封装了_locate_element()的几种方法，在具体使用封装过的代码的时候，只需要简单的调用即可。接下来的重点，是介绍 _locate_element(selector)的封装方式。

查找元素：find_element_by_...)
支持各种的查找：8种方式都需要支持，必须通过 selector 显示出分类
- 强制性用硬编码 hard code来实例化，例如 , 或者 ? 或者其他非常用字符 =>
- 或者，构造方法中，传递 this.byChar
要把查找到元素的返回给调用的地方：必须要有返回值，类型是 WebElement

 1 def _locate_element(self, selector):
 2     """
 3     to locate element by selector
 4     :arg
 5     selector should be passed by an example with "i,xxx"
 6     "x,//*[@id='langs']/button"
 7     :returns
 8     DOM element
 9     """
10     if self.by_char not in selector:
11         return self.base_driver.find_element_by_id(selector)
12  
13     selector_by = selector.split(self.by_char)[0].strip()
14     selector_value = selector.split(self.by_char)[1].strip()
15     if selector_by == "i" or selector_by == 'id':
16         element = self.base_driver.find_element_by_id(selector_value)
17     elif selector_by == "n" or selector_by == 'name':
18         element = self.base_driver.find_element_by_name(selector_value)
19     elif selector_by == "c" or selector_by == 'class_name':
20         element = self.base_driver.find_element_by_class_name(selector_value)
21     elif selector_by == "l" or selector_by == 'link_text':
22         element = self.base_driver.find_element_by_link_text(selector_value)
23     elif selector_by == "p" or selector_by == 'partial_link_text':
24         element = self.base_driver.find_element_by_partial_link_text(selector_value)
25     elif selector_by == "t" or selector_by == 'tag_name':
26         element = self.base_driver.find_element_by_tag_name(selector_value)
27     elif selector_by == "x" or selector_by == 'xpath':
28         element = self.base_driver.find_element_by_xpath(selector_value)
29     elif selector_by == "s" or selector_by == 'css_selector':
30         element = self.base_driver.find_element_by_css_selector(selector_value)
31     else:
32         raise NameError("Please enter a valid type of targeting elements.")
33  
34     return element

8.2 面向对象编程思想的运用

构造方法
类
普通方法

8.3 封装后的方法如何被调用

使用上面的封装类，就需要指定特定的 selector

具体调用示例

 1 def login(self, account, password, keep):
 2     """
 3     登录系统
 4     :param account:
 5     :param password:
 6     :param keep:
 7     :return: 返回保持登录复选框的 checked 值
 8     """
 9     self.base_driver.type(self.LOGIN_ACCOUNT_SELECTOR, account)
10     self.base_driver.type(self.LOGIN_PASSWORD_SELECTOR, password)
11  
12     current_checked = self.get_current_keep_value()
13     if keep:
14         if current_checked is None:
15             self.base_driver.click(self.LOGIN_KEEP_SELECTOR)
16     else:
17         if current_checked == "true":
18             self.base_driver.click(self.LOGIN_KEEP_SELECTOR)
19  
20     actual_checked = self.get_current_keep_value()
21     self.base_driver.click(self.LOGIN_SUBMIT_SELECTOR)
22     sleep(2)
23     return actual_checked

9. Page-Object设计模式介绍

9.1 Page-Object设计模式的本质

Page Object设计模式是Selenium自动化测试项目的最佳设计模式之一，强调测试、逻辑、数据和驱动相互分离。

Page Object模式是Selenium中的一种测试设计模式，主要是将每一个页面设计为一个Class，其中包含页面中需要测试的元素（按钮，输入框，标题等），这样在Selenium测试页面中可以通过调用页面类来获取页面元素，这样巧妙的避免了当页面元素id或者位置变化时，需要改测试页面代码的情况。当页面元素id变化时，只需要更改测试页Class中页面的属性即可。

它的好处如下：

集中管理元素对象，便于应对元素的变化
集中管理一个page内的公共方法，便于测试用例的编写
后期维护方便，不需要重复的复制和修改代码

具体的做法如下：

创建一个页面的类
在类的构造方法中，传递 WebDriver 参数。
在测试用例的类中，实例化页面的类，并且传递在测试用例中已经实例化的WebDriver对象。
在页面的类中，编写该页面的所有操作的方法
在测试用例的类中，调用这些方法

9.2 Page 如何划分

一般通过继承的方式，进行按照实际Web页面进行划分

9.3 Page-Object 类如何实现

实现的示例

Page 基类
- 设计了一个基本的 Page类，以便所有的页面进行继承，该类标明了一个sub page类的基本功能和公共的功能。
- 全局变量： self.base_driver，让所有的子类都使用的。

- 构造方法：
  - 传递 driver的构造方法

- 私有的常量：存放元素的定位符

1 LOGIN_ACCOUNT_SELECTOR = "s, #account"
2 LOGIN_PASSWORD_SELECTOR = "s, #password"
3 LOGIN_KEEP_SELECTOR = "s, #keepLoginon"
4 LOGIN_SUBMIT_SELECTOR = "s, #submit"
5 LOGIN_LANGUAGE_BUTTON_SELECTOR = "s, #langs > button"
6 LOGIN_LANGUAGE_MENU_SELECTOR = "s, #langs > ul > li:nth-child(%d) > a"
7 LOGIN_FAIL_MESSAGE_SELECTOR = "s, body > div.bootbox.modal.fade.bootbox-alert.in > div > div > div.modal-body"

- 成员方法：
  - 每个子类都需要的系统功能：
    - open

- - 所有子类（页面）都具有的业务功能
    - select_app
    - logout
- Sub Pages(s)子类
  - 具体的页面的类，定义了某个具体的页面的功能
  - 必须继承基类

- - 特定页面的业务
  - 使用基类的 self.base_driver 成员变量
- Tests 类
  - 这部分描述的是具体的测试用例。
  - 声明全局变量

- - 调用各种页面（pages）
  1. 实例化Page
    - self.main_page = MainPage(self.base_driver
  2. 使用page的对象，调用成员方法
  - - self.main_page.open(self.base_url)
    - self.main_page.change_language(lang)

10.构建测试方案
10.1 数据驱动在自动化测试中的应用

（1）什么是数据驱动?

主要的数据驱动方式有两种：

通过文本文件或者 Excel 文件存储数据，并通过程序读取数据，遍历所有的行
通过数据库存储数据，并通过程序和 SQL 脚本读取数据，遍历所有的行

通过 CSV 文件或者 MySQL 数据库，是主流的数据驱动方式。当然数据驱动也可以结合单元测试框架的参数化测试进行编写（此部分本文不做具体描述）。

无论使用了哪一种（CSV 或者 MySQL），读取数据后都要进行遍历操作。

（2）使用 csv

 1 import csv
 2  
 3 csv_file = open("xxx.csv", "r", encoding="utf8")
 4 csv_data = csv.reader(csv_file)
 5 for row in csv_data:
 6     # 进行测试
 7     # 使用字典类型
 8     data_to_test = {
 9       "key1": row[0],
10       "key2": row[1]
11     }
12  
13 csv_file.close()

（3）使用 MySQL

import pymysql
 
connect = pymysql.connect(host="xx", port=3306, user="root", passwd="xxx", db="xx")
cur = connect.cursor()
cur.execute("SELECT...")
mysql_data = cur.fetchall()
for row in mysql_data:
    # 进行测试
    # 使用字典类型
    data_to_test = {
      "key1": row[0],
      "key2": row[1]
    }
    
cur.close()
connect.close()

（4）需要掌握的知识点：

python的字典类型 dict 类型
python的读写文件
python的读写数据库
for循环
注意资源的释放
- 关闭数据库游标和连接
- 关闭文件

10.2 测试方案的编码实现

main.py 测试入口
runner.py 测试运行器
cases 测试用例
pages 测试页面
base 底层封装与驱动

10.3 测试报告的生成

如何生成测试报告
测试报告的种类
HTML 测试报告的生成
HTML测试报告需要引入HTMLTestRunner
HTMLTestRunner是基于Python2.7的，我们的课程讲义基于Python3.x，那么需要对这个文件做一定的修改。

测试的示例代码如下

 1 # 声明一个测试套件
 2 suite = unittest.TestSuite()
 3 # 添加测试用例到测试套件
 4 suite.addTest(RanzhiTests("test_ranzhi_login"))
 5  
 6 # 创建一个新的测试结果文件
 7 buf = open("./result.html", "wb")
 8  
 9 # 声明测试运行的对象
10 runner = HTMLTestRunner.HTMLTestRunner(stream=buf,
11                                        title="Ranzhi Test Result",
12                                        description="Test Case Run Result")
13 # 运行测试，并且将结果生成为HTML
14 runner.run(suite)
15  
16 # 关闭文件输出
17 buf.close()

posted @ 2019-08-05 18:19 nykuo 阅读(1680) 评论(0) 收藏举报

刷新页面返回顶部

nykuo

selenium浏览器自动化测试框架文档（修正版）

9. Page-Object设计模式介绍

公告