摘要: Beautiful Soup是python的一个HTML或XML的解析库,我们可以用它来方便的从网页中提取数据,它拥有强大的API和多样的解析方式。 Beautiful Soup的三个特点: Beautiful Soup提供一些简单的方法和python式函数,用于浏览,搜索和修改解析树,它是一个工具 阅读全文
posted @ 2018-06-23 18:56 Py.qi 阅读(24902) 评论(1) 推荐(6) 编辑
摘要: lxml是python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高 XPath,全称XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的语言,它最初是用来搜寻XML文档的,但是它同样适用于HTML文档的搜索 XPath的选择功 阅读全文
posted @ 2018-06-23 00:47 Py.qi 阅读(164520) 评论(1) 推荐(9) 编辑