摘要: xpath的| 相当与交集 本爬虫爬取的是热门城市和全国城市,但是由于爬取的规则不同,所以在同一个xpath中使用了两种规则 阅读全文
posted @ 2019-08-25 21:28 zx125 阅读(161) 评论(0) 推荐(0) 编辑
摘要: import this (具体实现方法和原理参考:http://www.ituring.com.cn/article/507009) 当运行import this这段代码时,会输出 以上就是Pythonic方式 阅读全文
posted @ 2019-08-25 20:51 zx125 阅读(166) 评论(0) 推荐(0) 编辑
摘要: 4k图片爬取+中文乱码 此案例有三种乱码解决方法,推荐第一种 4k图片爬取其实和普通图片爬取的过程是没有本质区别的 阅读全文
posted @ 2019-08-25 20:40 zx125 阅读(374) 评论(0) 推荐(0) 编辑
摘要: xpath xpath两种使用方式 和bs类似,一种是调用本地资源,一种是网络资源 xpath表达式 层级:/一个层级 //多个层级 (注意如果从html开始取,要在前面加一个/ 写成/html,局部./li) 属性定位:类似//div[@class='zx'] 索引取值: 类似p[3](注意xpa 阅读全文
posted @ 2019-08-25 16:31 zx125 阅读(356) 评论(0) 推荐(0) 编辑