摘要: lxml 是 一个HTML/XML的解析器,主要的功能是如何解析和提取 HTML/XML 数据。 一、lxml示例 1、初步 # 使用 lxml 的 etree 库 from lxml import etree text = ''' <div> <ul> <li class="item-0"><a 阅读全文
posted @ 2020-04-26 16:15 样子2018 阅读(3880) 评论(0) 推荐(0) 编辑
摘要: 一、xpath规则 XPath (XML Path Language) 是一门在 XML 文档中查找信息的语言,可用来在 XML 文档中对元素和属性进行遍历。 阅读全文
posted @ 2020-04-26 12:44 样子2018 阅读(358) 评论(0) 推荐(0) 编辑
摘要: 一、正则匹配规则 二、常用函数 match 方法:从起始位置开始查找,一次匹配 search 方法:从任何位置开始查找,一次匹配 findall 方法:全部匹配,返回列表 finditer 方法:全部匹配,返回迭代器 split 方法:分割字符串,返回列表 sub 方法:替换 1、match示例 > 阅读全文
posted @ 2020-04-26 10:35 样子2018 阅读(192) 评论(0) 推荐(0) 编辑