摘要: 一、主要思路 二、文件说明 itemsscray字段 piplines.py存储数据库 setting.py scrapy配置 需要注意的是DEFAULT_REQUEST_HEADERS的设置,需要模拟登录 mz.py是主要爬虫 都是基本的爬虫功能,css+xpath+正则 start_urls = 阅读全文
posted @ 2016-01-18 19:47 yinsolence 阅读(4222) 评论(14) 推荐(1) 编辑