快速从html页面解析出数据

爬虫基本入门方法

场景：

1、当接口返回接口为xml

2、想从页面上解析想要的数据文本

使用

pip3 install lxml

import request

from lxml import etree

r = requests.post(url,data).text

#复制html内容

html_demo = ' '

#使用etree.HTML 解析html的内容

#demo = etree.HTML(html_demo)

demo = etree.HTML( r )

nodes = demo.xpath(' ') #填xpath路径

#获取文本

t = nodes[0].text

print(t)

posted @ 2020-03-18 23:41 dearddu 阅读(1300) 评论(0) 收藏举报

刷新页面返回顶部