xpath语法

一.曾经最头疼的问题

xpath中  // 与 .//   的区别

1 <span style="font-family:SimSun;"><a>  
2   <b>blank</b>  
3     <c id="z">  
4       <b>content</b>  
5     </c>    
6 </a></span>  

上面是一个简单的示例文档结构,在selenium中webElement也有一个findElement的方法,用于查找该元素下的子孙元素,假如我们已经获得了C元素,我们现在要获取C元素下的b元素:请注意以下两种代码的区别。

写法一:webElement b = C.findElement(By.xpath(".//b"))

写法二:webElement b = C.findElement(By.xpath("//b"))

其实两个代码的区别就在于xpath路径加不加点的问题上,事实证明,写法一取到的是包含blank的b元素,而写法二取到的是包含content的b元素。所以其实加点和不加点是有很大区别的,在查找整个页面的时候没有区别,但是在当前元素调用此方法时就有了,加点代表取当前元素为根节点向下查找元素,而不加点是以整个页面为根元素向下查找的。所以firePath这个插件还是很智能的,默认给xpath路径加上了点,以防止在当前元素下找元素时发生错误。

 

二.基础语法

位置路径

 位置路径标识了和上下文有关的一组XPath节点,是XPath表达式的特化,使用'/'表示层级关系。
 
 位置路径有相对路径和绝对路径。
 
   相对路径:
     "nodename/childnodename"
      该路径在当前节点下查找到符合nodename的节点,再寻找nodename的子节点childnodename。
      路径的开始位置是 当前节点 。
   
   绝对路径
     "/nodename/childnodename"
      在路径字串前加了一个'/',表示字串从根开始表示,也就是nodename必须是表示根节点,才能找到childnodename。
     
  其它路径符号
  
    // 搜索所有位置节点。
      "//nodename"
       文档树中的所有名为nodename的节点。
      "//nodename/childnodename"
       文档树中的所有父元素名为nodename的childnodename节点。

   . 引用节点自身
     "./nodename/childnodename"
      是"nodename/childnodename"的完整写法,作用一致。
     ".//nodename"
      当前节点下的所有nodename节点。

   .. 引用节点自身的父节点
     "../nodename"
      nodename的父节点。
     "../nodename/othernodename"
      nodename的父节点的子节点othernodename,选择到的是nodename的兄弟节点。
      
   * 通配符号。
    "nodename/*"
     表示nodename的任意名称的子节点。
   
   [] 谓词符号,用于筛选元素。比如,list/item[2] 代表第二个 item 元素。实际上 [] 是一个谓词(参见 谓词)。
    "nodename[1]"
     表示nodename的第一个子节点。
    "nodename[@ss=/"1/"]"
     表示有属性ss值等于"1"的nodename节点。
     谓词中还可以使用其它的boolean表达式。
    
   @ 属性符号,后跟属性名。@* 也可以使用通配符表示所有属性。
    "nodename/childnodename[@ss]"
     筛选nodename/childnodename,找出拥有属性ss的。

   | 分隔符号,分隔多个路径
    "nodename/childnodename | nodename/otherchildnodename"
     节点nodename的childnodename和otherchildnodename节点。 

更多点击:http://www.w3school.com.cn/xpath/xpath_examples.asp

posted @ 2018-04-21 19:51  不停地走  阅读(220)  评论(0编辑  收藏  举报