scrapy新版本特性

1:在spider中返回一个自定义的字典,老版本中需要先定义一个Item,填充后再返回一个对象

 

    新版本中可以直接返回一个字典

2:Per-spider settings  为每个spider进行单独设置,以前只能在settings文件中设置,在settings中的设置是全局的会作用到每个spider,当有多个spider的时候就不好处理

  在spider中定义个custom_settings的对象

3:移除了Twisted的logging模块,使用python内置的logging模块

4:重构Crawler API Crawler API refactoring

posted @ 2016-11-15 11:47  kakaok  阅读(1214)  评论(0编辑  收藏  举报