爬虫相关知识(二 )xpath

#xpath表达式的基本格式

# 斜杠(/)作为路径内部的分割符。

# 同一个节点有绝对路径和相对路径两种写法。

# 绝对路径(absolute path)必须用"/"起首,后面紧跟根节点,比如/step/step/...。

# 相对路径(relative path)则是除了绝对路径以外的其他写法,比如 step/step,也就是不使用"/"起首。

# "."表示当前节点。

# ".."表示当前节点的父节点
选择节点的基本规则

- nodename(节点名称):表示选择该节点的所有子节点

- "/":表示选择根节点

- "//":表示选择任意位置的某个节点

- "@": 表示选择某个属性
通配符

# "*"表示匹配任何元素节点。

# "@*"表示匹配任何属性值。
 //title[@*] :表示选择所有带有属性的title元素。
 # node()表示匹配任何类型的节点。 
选择多个路径

用"|"选择多个并列的路径。

//book/title | //book/price :表示同时选择book元素的title子元素和price子元素。

 

posted @ 2018-06-02 22:22  似水年华梦  阅读(110)  评论(0编辑  收藏  举报