摘要: xpath 一、常用xpath表达式 属性定位: #找到class属性值为song的div标签 //div[@class="song"] 层级&索引定位: #找到class属性值为tang的div的直系子标签ul下的第二个子标签li下的直系子标签a //div[@class="tang"]/ul/l 阅读全文
posted @ 2019-03-25 00:05 silencio。 阅读(720) 评论(0) 推荐(0) 编辑
摘要: urllib模块 urllib是Python自带的一个用于爬虫的库,其主要作用就是可以通过代码模拟浏览器发送请求。其常被用到的子模块在Python3中的为urllib.request和urllib.parse,在Python2中是urllib和urllib2。 一、使用流程: 指定url 基于url 阅读全文
posted @ 2019-03-25 00:03 silencio。 阅读(1991) 评论(0) 推荐(0) 编辑