5.5.8 XPath定位

1.什么是XPath

XPath定位方式是自动化测试定位技术中的必杀技，几乎可以解决所有的定位难题。它是XML Path语言的缩写，主要用于在XML 文档中选择文档中的节点。基于XML树状文档结构，XPath语言可以用于在整颗树中寻找指定的节点。由于网页的HTML代码是一种特殊的XML文档，因此XPath也支持在HTML代码中定位HTML树状文档结构中的节点。它是一种选择器，在firefox中用firepath可查看。

2.XPath语法

被测试网页的HTML代码（xPathDemo.html下载）

<html>
    <body>
        <div id="div1">
            <input name="div1input"></input>
            <a href="http://www.sogou.com">搜狗搜索</a>
            <img alt="div1-img1" src="http://www.sogou.com/images/logo/new/sogou.png" href="http://www.sogou.com">搜狗图片</img>
            <input type="button" value="查询" />
        </div>
        <br/>
        <div name="div2">
            <input name="div2input"></input>
            <a href="http://www.baidu.com">百度搜索</a>
            <img alt="div2-img" src="http://www.baidu.com/img/bdlogo.png" href="http://www.baidu.com">百度图片</img>
        </div>
    </body>
</html>

（1）使用绝对路径来定位元素

例：在被测试网页中，查找第一个div标签中的按钮。

Java定位语句：WebElement button=driver.findElement(By.xpath("/html/body/div/input[@value='查询']"));

代码解释：/表示根目录，绝对路径。该表达式从HTML代码的最外曾节点逐层查找，最后定位到按钮节点。

说明：使用绝对路径定位方式的好处在于可以验证页面是否发生变化。如果页面发生变化，一般会造成原有定位成功的XPaht表达式定位失败，由此可发现网页结构发生了改变。使用绝对路径定位是十分脆弱的，因为即便页面代码发生了微小的变化，也会造成原有的XPath表达式定位失败。在自动化测试的定位中，优先推荐使用相对路径定位方式。

（2）使用相对路径来定位元素

例：在被测试网页中，查找第一个div标签中的按钮。

Java定位语句：WebElement button=driver.findElement(By.xpath("//input[@value='查询']"));

代码解释：XPath表达式中的“//”表示在HTML文档的全部层级位置进行查找，input[@value="查询"]表示定位显示“查询”两个字的按钮。

说明：相对路径的XPath表达式更简洁，不管页面发生了何种变化，只要input的value值是“查询”两个字就可以被定位到。推荐使用相对路径的XPath表达式，可大大降低测试脚本中定位表达式的维护成本。

（3）使用索引号进行定位

例：在被测试网页中，查找第二个div标签中的“查询”按钮。

XPath表达式：//input[2]

代码解释：根据元素类型在页面中出现的先后顺序，可以使用序号来查找指定的页面元素。本实例的XPath表达式表示查找页面中第二个出现的input元素，即被测试页面上的按钮元素。

说明：如果使用“//input[1]”，会定位到两个输入框元素，因为每个div里面均包含input元素，XPath在查找的时候把每个div节点当作相同的起始层级开始查找，所以使用“//input[1]”表达式会同时查找到两个div节点中的第一个input元素。因此在使用序号进行页面定位元素的时候，需要注意网页HTML代码中是否包含多个层级完全相同的代码结构，若包含多个则会定位到多个页面元素。

若页面元素经常被发现新增或者减少的情况，不建议使用索引号定位的方式，因为页面变化很可能会让使用索引号的XPath表达式定位失败。

（4）使用页面元素的属性值定位元素实例

在定位页面元素的时候，会遇到各种复杂结构的网页，并且经常出现无法使用ID、name方式定位的情况。若不想使用绝对路径的定位方式，又搞不清楚到底使用什么序号来定位页面元素，那么推荐使用属性值定位元素的方式。

例：尝试定位被测试网页中的第一个图片元素。

Java定位语句：WebElement img=driver.findElement(By.xpath("//img[@alt='div1-img1']"));

代码解释：表达式使用了相对路径定位方式，并且使用了图片的alt属性值来进行定位，通过查看页面的HTML代码可获取图片的alt值。

说明：被测试网页的元素通常会包含各种各样的属性值，并且很多属性值具有唯一性。若能确认属性值发生变更的可能性很低且具有唯一值，强烈建议使用相对路径方式结合属性值定位的方式来编写XPath定位表达式，基于此定位方法可解决99%的页面元素定位难题。

练习：试着去说出下面的定位元素：

//img[@href='http://www.sogou.com']
//div[@name='div2']/input[@name='div2input']
//div[@id='div']/a[@href='http://www.sogou.com']
//input[@type='button']

（5）使用模糊的属性值定位元素

在自动化测试的实施过程中，会遇到另外一种情况：页面元素的属性值会被动态地生成，即每次看到的页面元素属性值是不一样的，此类页面元素会加大定位难度，使用模糊的属性值定位方式可解决一部分此类难题。XPath函数可实现模糊属性值的定位需求。

XPath常用函数如下表所示。

XPath函数	定位表达式实例	表达式解释
Starts-with()	//img[starts-with(@alt,'div1')]	查找图片alt属性开始位置包含"div1"关键字的页面元素
Contains()	//img[contains(@alt,'g1')]	查找图片alt属性包含“g1”关键字的页面元素

Contains()函数属于XPath函数的高级用法，使用场景较多，页面元素的属性值只要具有固定不变的几个关键字，即使页面元素的属性值经常发生一定程度的变化，依旧可以使用Contians()函数进行定位。

（6）使用XPath的轴（Axis）进行元素定位

轴可定义相对于当前节点的节点集。使用XPath轴（Axis）方式可依据在文档树中的元素相对位置关系进行定位。先找到一个相对好定位的元素，依据它和要定位元素的相对位置进行定位，可解决一些元素难以定位的问题。

语法为：轴名称::节点。

XPath轴关键字	轴的含义说明	定位表达式实例	表达式解释
parent	选择当前节点的上层父节点	//img[@alt='div2-img2']/parent::div	查找到alt属性值为div2-img的图片，并基于图片位置找到它上一级的div页面元素
child	选择当前节点的下层子节点	//div[@id='div1']/child::img	查找到ID属性值为div1的div页面元素，并基于div的位置找到它下层节点中的img页面元素
ancestor	选择当前节点所有上层的节点	//img[@alt='div2-img2']/ancestor::div	查找到alt属性值为div2-img的图片，并基于图片位置找到它上级的div页面元素
descedant	选择当前节点所有下层的节点	//div[@name='div2']/descendant::img	查找到name属性值的div页面元素，并基于div的位置找到它下级所有节点中的img页面元素
following	选择在当前节点之后显示的所有节点	//div[@id='div1']/following::img	查找到ID属性值为div1的div页面元素，并基于div的位置找到他后面节点中的img页面元素
following-sibling	选择当前节点之后的所有平级节点	//a[@href='http://www.sogou.com']/following-sibling::input	查找到链接地址为http://www.sogou.com的链接页面元素，并基于链接的位置找到它同级节点中的input页面元素
preceding	选择当前节点前面的所有节点	//img[@alt='div2-img2']/preceding::div	查找到alt属性值为div2-img2的图片页面元素，并基于图片的位置找到它前面节点中的div页面元素
preceding-sibling	选择当前节点前面的所有同级节点	//img[@alt='div2-img2']/preceding-sibling::a[1]	查找到alt属性值为div2-img2的图片页面元素，并基于图片的位置找到它前面同级节点中的第二个链接页面元素

（7）使用页面元素的文本来定位元素

使用text()函数可以定位到包含某些关键字的页面元素。

//a[text()='百度搜索']
//a[contains(text(),'百度')]
//a[contians(text(),'百度')]/preceding::div

说明：使用文字匹配模式进行定位，为定位复杂的页面元素提供了一种强大的定位模式，在遇到定位困难的时候，可优先使用此方法进行定位。建议使用此定位方式进行大量练习，做到可随意定位到页面中的任意元素。

3.总结

（1）常用符号说明

/表示根目录，绝对路径
//表示相对路径
.表示当前层
..表示上一层
*表示通配符
@表示属性
[]属性的判断条件表达式

（2）路径表达式查看

在网页元素上，点击鼠标右键，选择“Inspect in File Path”，可查看某个网页元素的xpath路径。例如，定位百度首页的“新闻”元素。

（3）函数

contians

//div[contains(@id,'in')]，表示选择id中包含有'in'的div节点

text()

<a class="baidu" href="http://www.baidu.com">baidu</a>

查找节点的文本值为baidu的超链接，//a[text()='baidu']

last()

//input[@name='identity' or @class='Volvo'][last()]，取最后一个

starts-with()

//div[starts-with(@id,'in')]，表示选择以id属性为'in'开头的div节点

not()

//input[@name='identity' and not(contains(@class,'A'))]，表示匹配出name为identity并且class的值中不包含A的input节点

//input[not(@id)]，匹配出input节点不含有id属性的节点。

（4）xpath轴练习

以axisDemo2网页（下载）为例，进行讲解

//div[@id='radio']//label[text()='Saab']/preceding-sibling::input是什么意思？

//input[following-sibling::label[text()='Saab']]是什么意思？

posted @ 2016-04-20 23:23 RunningYY 阅读(948) 评论(0) 编辑收藏举报

长颈鹿的围巾

All that really matters is you don't stop trying.最关键的是，不要放弃尝试。

5.5.8 XPath定位