摘要: 爬取网页异步js渲染的数据,个人想到两种思路: 1、模拟请求得到返回的json数据,解析后爬取需求数据。 2、模拟浏览器加载完成后再正则匹配获取页面需求数据。 下面是第一种方法练习代码,后续学习中。。。 阅读全文
posted @ 2018-01-28 23:55 MrGaoyi 阅读(156) 评论(0) 推荐(0) 编辑
摘要: 接触python不久,也在慕课网学习了一些python相关基础,对于爬虫初步认为是依靠一系列正则获取目标内容数据 于是参照着慕课网上的教学视频,完成了我的第一个python爬虫,鸡冻 >_< 阅读全文
posted @ 2018-01-28 01:19 MrGaoyi 阅读(146) 评论(0) 推荐(0) 编辑