摘要: 学习了一段时间的scrapy爬虫框架,也模仿别人的写了几个。最近,在编写爬取拉勾网某职位相关信息的过程中,遇到一些小的问题,和之前一般的爬取静态网页略有不同,这次需要提取的部分信息是js生成的。记录一下,后续备查。 整个project的文件结构如下所示: ├── lagou_python │ ├── __init__.py │ ├── items.py │ ... 阅读全文
posted @ 2015-06-01 13:24 ShadonSniper 阅读(2933) 评论(1) 推荐(0) 编辑
摘要: 学习了一段时间的scrapy爬虫框架,也模仿别人的写了几个。最近,在编写爬取拉勾网某职位相关信息的过程中,遇到一些小的问题,和之前一般的爬取静态网页略有不同,这次需要提取的部分信息是js生成的。记录一下,后续备查。 整个project的文件结构如下所示: ├── lago... 阅读全文
posted @ 2015-06-01 13:20 ShadonSniper 阅读(308) 评论(0) 推荐(0) 编辑