会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
领域见识决定专业高度
博客园
首页
新随笔
联系
订阅
管理
2017年6月12日
使用Scrapy采集
摘要: 1、有些站点通过robot协议,防止scrapy爬取,就会出现如下问题: 解决方案:settings.py 文件中:ROBOTSTXT_OBEY = False(默认为true) 2、shell中执行爬虫会看到很多乱七八糟的日志输入 3、爬虫执行日志输出到指定文件中 4、爬去结果保存为指定格式
阅读全文
posted @ 2017-06-12 16:01 迁梦余光
阅读(296)
评论(0)
推荐(0)
编辑