会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
To be a data scientist
数据科学相关的学习笔记,实践心得
博客园
首页
新随笔
联系
订阅
管理
2017年3月7日
Python拉勾爬虫——以深圳地区数据分析师为例
摘要: 拉勾因其结构化的数据比较多因此过去常常被爬,所以在其多次改版之下变得难爬。不过只要清楚它的原理,依然比较好爬。其机制主要就是AJAX异步加载JSON数据,所以至少在搜索页面里翻页url不会变化,而且数据也不会出现在源代码里。 数据解析 这是 "深圳地区的数据分析师页面" ,用Chrome检查打开。在
阅读全文
posted @ 2017-03-07 20:25 依然很拉风
阅读(1798)
评论(3)
推荐(0)
编辑