摘要: HTML解析库BeautifulSoup4 BeautifulSoup 是一个可以从HTML或XML文件中提取数据的Python库,它的使用方式相对于正则来说更加的简单方便,常常能够节省我们大量的时间。 BeautifulSoup也是有官方中文文档的:https://www.crummy.com/s 阅读全文
posted @ 2018-10-01 21:16 ThinkaboutFutuer 阅读(120) 评论(0) 推荐(0) 编辑
摘要: 更简单高效的HTML数据提取-Xpath XPath 是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。 相比于BeautifulSoup,Xpath在提取数据时会更加的方便。 安装 在Python中很多库都有提供Xpath的功能,但是最基本的还是lx 阅读全文
posted @ 2018-10-01 11:23 ThinkaboutFutuer 阅读(268) 评论(0) 推荐(0) 编辑