摘要:
from:https://www.cnblogs.com/ospider/p/5911339.html 最近要做下微信爬虫,之前写个小东西都是直接用正则提取数据就算了,如果需要更稳定的提取数据,还是使用 xpath 定位元素比较可靠。周末没事,从爬虫的角度研究了一下 python xml 相关的库。 阅读全文
摘要:
<div> <a href="xxxx">123</a> <a href="xxxx">45</a><div> <div> 123 45<div> 请问使用lxml的etree,etree.xpath 怎么一种方式获取内容 div里的12345? 方案2.etree改用document_fromst 阅读全文