核心重点lxml

from lxml import html


htmlStr = html.etree.HTML(pagehtml, parser= html.etree.HTMLParser(encoding='utf-8'))  #将网页源码转换为 XPath 可以解析的格式

nr= html.tostring(nr,encoding="utf-8").decode(  )

posted @ 2018-10-10 17:16 zzg168 阅读(138) 评论(0) 收藏举报

刷新页面返回顶部