摘要: 一.创建爬虫工程 二.创建爬虫 三.明确需要爬取的内容(各种存储,方便可持续化用) 1.打开MySpider目录下的item.py 2.Item定义结构化数据,用来保存爬取到的数据,类似字典 3.创建TencentItem类 四.设置爬虫初始url,解析数据获取想要的内容和生成爬虫过程中另外生成的u 阅读全文
posted @ 2018-03-06 16:08 氢气球很漂亮 阅读(154) 评论(0) 推荐(0) 编辑