2017 年 10月 6 日随笔档案 - YangPython

2017年10月6日

摘要：目标任务：将之前新浪网的Scrapy爬虫项目，修改为基于RedisSpider类的scrapy-redis分布式爬虫项目，将数据存入redis数据库。一、item文件，和之前项目一样不需要改变二、spiders爬虫文件，使用RedisSpider类替换之前的Spider类，其余地方做些许改动即可阅读全文

posted @ 2017-10-06 15:42 YangPython 阅读(16985) 评论(0) 推荐(1) 编辑

Python爬虫框架Scrapy实例（二）

摘要：目标任务：使用Scrapy框架爬取新浪网导航页所有大类、小类、小类里的子链接、以及子链接页面的新闻内容，最后保存到本地。大类小类如下图所示：点击国内这个小类，进入页面后效果如下图（部分截图）：查看页面元素，得到小类里的子链接如下图所示：有子链接就可以发送请求来访问对应新闻的内容了。首先创建阅读全文

posted @ 2017-10-06 15:23 YangPython 阅读(10692) 评论(2) 推荐(1) 编辑

YangPython

公告