2018 年 10月 1 日随笔档案 - ThinkaboutFutuer

2018年10月1日

摘要： HTML解析库BeautifulSoup4 BeautifulSoup 是一个可以从HTML或XML文件中提取数据的Python库，它的使用方式相对于正则来说更加的简单方便，常常能够节省我们大量的时间。 BeautifulSoup也是有官方中文文档的：https://www.crummy.com/s 阅读全文

posted @ 2018-10-01 21:16 ThinkaboutFutuer 阅读(120) 评论(0) 推荐(0) 编辑

更简单高效的HTML数据提取-Xpath

摘要：更简单高效的HTML数据提取-Xpath XPath 是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。相比于BeautifulSoup，Xpath在提取数据时会更加的方便。安装在Python中很多库都有提供Xpath的功能，但是最基本的还是lx 阅读全文

posted @ 2018-10-01 11:23 ThinkaboutFutuer 阅读(268) 评论(0) 推荐(0) 编辑

ThinkaboutFutuer

公告