摘要: 我们在用python开发的时候,随着开发应用的增多,比如这个项目用django开发后台,之后又用scrapy来开发爬虫应用等,如果不用虚拟环境这些软件包都会被放到python的site-package目录下,为了项目整洁最好给每个项目各自创建一个独立的python虚拟环境。 1.pip instal 阅读全文
posted @ 2018-03-27 23:22 筱筱的春天 阅读(4634) 评论(0) 推荐(0) 编辑
摘要: 1.Scrapy是蜘蛛爬虫框架,我们用蜘蛛来获取互联网上的各种信息,然后再对这些信息进行数据分析处理。 2.Scrapy的组成 引擎:处理整个系统的数据流处理,出发事务 调度器: 接受引擎发过来的请求,压入队列中,并在引擎再次请求的时候返回 下载器: 下载网页内容,并将网页内容返回给蜘蛛 蜘蛛: 蜘 阅读全文
posted @ 2018-03-27 11:49 筱筱的春天 阅读(1290) 评论(0) 推荐(0) 编辑