爬虫实战(二) 51job移动端数据采集
摘要:
在上一篇51job职位信息的爬取中,对岗位信息div下各式各样杂乱的标签,简单的Xpath效果不佳,加上string()函数后,也不尽如人意。因此这次我们跳过桌面web端,选择移动端进行爬取。 一、代码结构 按照下图所示的爬虫基本框架结构,我将此份代码分为四个模块——URL管理、HTML下载、HTM 阅读全文
posted @ 2018-12-16 22:29 Magic激流 阅读(1088) 评论(0) 推荐(1) 编辑