xpath常用
<!DOCTYPE html> <html lang="en"> <body> <h1 class='name'>10086</h1> <h1 class='name'>10000</h1> <div> <ul> <li id="ip">192.168.1.1</li> <li id="port">9999</li> <li id='http'>http</li> <li id='nname'>高匿名</li> </ul> </div> <div> <a href="https://www.baidu.com/">百度</a> <a href="https://www.bing.com/">必应</a> <a href="https://www.google.com/">谷歌</a> </div> </body> </html>
xpath表达式:
- /:表示的是从根节点开始定位。表示的是一个层级。
- //:表示的是多个层级。可以表示从任意位置开始定位。
- 属性定位://div[@class='song'] tag[@attrName="attrValue"]
- 索引定位://div[@class="song"]/p[3] 索引是从1开始的。
- 取文本:
- /text() 获取的是标签中直系的文本内容
- //text() 标签中非直系的文本内容(所有的文本内容)
- 取属性:
/@attrName ==>//img/@src
人生苦短,慢慢潇洒。
nsyw.run