会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
积土成山,风雨兴焉
博客园
首页
新随笔
联系
管理
订阅
2018年5月18日
Scrapy爬虫框架第七讲【ITEM PIPELINE用法】
摘要: ITEM PIPELINE用法详解: ITEM PIPELINE作用: 清理HTML数据 验证爬取的数据(检查item包含某些字段) 去重(并丢弃)【预防数据去重,真正去重是在url,即请求阶段做】 将爬取结果保存到数据库中 ITEM PIPELINE核心方法(4个) (1)、open_spider
阅读全文
posted @ 2018-05-18 23:04 疾风_lu
阅读(6029)
评论(0)
推荐(0)
编辑
公告