摘要: 一、简介 lxml是python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高。 XPath的选择功能十分强大,它提供了非常简明的路径选择表达式,另外,它还提供了超过100个内建函数,用于字符串、数值、时间的匹配以及节点、序列的处理等,几乎所有我们想要定位的节点 阅读全文
posted @ 2021-08-18 19:49 Einewhaw 阅读(393) 评论(0) 推荐(0) 编辑
摘要: 一、简介 requests是使用Apache2 licensed 许可证的HTTP库。用python编写。比urllib2模块更简洁。 Request支持HTTP连接保持和连接池,支持使用cookie保持会话,支持文件上传,支持自动响应内容的编码,支持国际化的URL和POST数据自动编码。 在pyt 阅读全文
posted @ 2021-08-18 11:46 Einewhaw 阅读(205) 评论(0) 推荐(0) 编辑
摘要: 一、简介 urllib 是一个收集了多个涉及 URL 的模块的包: urllib.request 打开和读取 URL urllib.error 包含 urllib.request 抛出的异常 urllib.parse 用于解析 URL urllib.robotparser 用于解析 robots.t 阅读全文
posted @ 2021-08-18 11:27 Einewhaw 阅读(16) 评论(0) 推荐(0) 编辑