lxml etree的一个问题

<div>
<a href="xxxx">123</a>
<a href="xxxx">45</a>
<div>


<div>
123
45
<div>

 

请问使用lxml的etree,etree.xpath 怎么一种方式获取内容 div里的12345?

 

方案1.lxml有一个html模块导入

 

 from lxml import html
 root = html.fromstring('''<div><a href="xxxx">123</a><a href="xxxx">45</a><div>''')

  root.text_content()

 

  

 

方案2.etree改用document_fromstring

import lxml.html
root = lxml.html.document_fromstring('''<div><a href="xxxx">123</a><a href="xxxx">45</a><div>''')

root.text_content()

  


posted @ 2018-02-19 13:30  公众号python学习开发  阅读(248)  评论(0编辑  收藏  举报