快速从html页面解析出数据
如何快速从html页面解析出我们想要的数据
爬虫基本入门方法
场景:
1、当接口返回接口为xml
2、想从页面上解析想要的数据文本
使用
pip3 install lxml
import request
from lxml import etree
r = requests.post(url,data).text
#复制html内容
html_demo = ' '
#使用etree.HTML 解析html的内容
#demo = etree.HTML(html_demo)
demo = etree.HTML( r )
nodes = demo.xpath(' ') #填xpath路径
#获取文本
t = nodes[0].text
print(t)