摘要: pyquery简介 如果你对CSS选择器很熟的话则可以使用它,Pyquery同Beautiful Soup一样,需要传入一个HTML 文本来初始化pQuery对象,而且它的初始化有多种方式,例如直接传入字符长、URL、文件名等、 pyquery基本用法 字符串初始化 html = ''' <div> 阅读全文
posted @ 2018-12-25 21:38 Coolc 阅读(93) 评论(0) 推荐(0) 编辑
摘要: Beautiful Soup简介 Beautiful Soup是python一个HTML或XML解析库,是一款强大的解析工具,它借助于网页结构和属性等特征来解析网页。它的出现使得我们不用再去写协议复杂的正则表达式,而只需几个语句就可以对网页中的某个元素进行提取,提高了解析效率。但是在使用中Beaut 阅读全文
posted @ 2018-12-25 18:47 Coolc 阅读(161) 评论(0) 推荐(0) 编辑
摘要: XPath规则: XPath用法如下: 通过XPath对网页进行解析简单示例 text =''' <div> <ul> <li class="item-0"><a herf="link1.html">first item</a></li> <li class="item-1"><a herf="li 阅读全文
posted @ 2018-12-25 17:51 Coolc 阅读(271) 评论(0) 推荐(0) 编辑