scrapy新版本特性
1:在spider中返回一个自定义的字典,老版本中需要先定义一个Item,填充后再返回一个对象
新版本中可以直接返回一个字典
2:Per-spider settings 为每个spider进行单独设置,以前只能在settings文件中设置,在settings中的设置是全局的会作用到每个spider,当有多个spider的时候就不好处理
在spider中定义个custom_settings的对象
3:移除了Twisted的logging模块,使用python内置的logging模块
4:重构Crawler API Crawler API refactoring