摘要: JsonPath pip install jsonpath JsonPath 是一种信息抽取类库,是从JSON文档中抽取指定信息的工具,提供多种语言实现版本,包括:Javascript, Python, PHP 和 Java。 JsonPath 对于 JSON 来说,相当于 XPATH 对于 XML 阅读全文
posted @ 2019-11-22 17:15 lshan 阅读(202) 评论(0) 推荐(0) 编辑
摘要: 和 lxml 一样,Beautiful Soup 也是一个HTML/XML的解析器,主要的功能也是如何解析和提取 HTML/XML 数据。 lxml 只会局部遍历,而Beautiful Soup 是基于HTML DOM的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多,所以性能要低于 阅读全文
posted @ 2019-11-22 17:13 lshan 阅读(186) 评论(0) 推荐(0) 编辑
摘要: 模糊查询: def Sprider1(): pass url="http://juji123.net/tag/5_2.html" headers={ "User-Agent":"Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 ( 阅读全文
posted @ 2019-11-22 17:12 lshan 阅读(197) 评论(0) 推荐(0) 编辑