爬虫相关知识(二 )xpath
#xpath表达式的基本格式 # 斜杠(/)作为路径内部的分割符。 # 同一个节点有绝对路径和相对路径两种写法。 # 绝对路径(absolute path)必须用"/"起首,后面紧跟根节点,比如/step/step/...。 # 相对路径(relative path)则是除了绝对路径以外的其他写法,比如 step/step,也就是不使用"/"起首。 # "."表示当前节点。 # ".."表示当前节点的父节点
选择节点的基本规则 - nodename(节点名称):表示选择该节点的所有子节点 - "/":表示选择根节点 - "//":表示选择任意位置的某个节点 - "@": 表示选择某个属性
通配符 # "*"表示匹配任何元素节点。 # "@*"表示匹配任何属性值。
//title[@*] :表示选择所有带有属性的title元素。
# node()表示匹配任何类型的节点。
选择多个路径 用"|"选择多个并列的路径。 //book/title | //book/price :表示同时选择book元素的title子元素和price子元素。