摘要:
三种方式: 1.多进程多线程(不建议) 2.进程池或者线程池(适当) 3.单线程+异步协程(推荐) 多进程多线程 占用cpu资源,不建议使用 基于线程池的异步爬虫 结果: 单线程+异步协程 基本使用 task的使用 future的使用 绑定回调 多任务异步协程 执行结果: 结果发现,并没有实现异步, 阅读全文
摘要:
scrapy框架 框架 -具有很多功能且具有很强通用性的一个项目模板 环境安装: 创建一个工程 scrapy startprobject proName cd proName 创建爬虫文件: scrapy genspider spiderName www.xxx.com 执行工程: 阅读全文