摘要:
命令行工具(Command line tools) 全局命令 startproject settings runspider shell fetch view version 项目命令 crawl check list edit parse genspider deploy bench 1、创建爬虫 阅读全文
摘要:
继上篇《python之urllib2简单解析HTML页面》之后学习使用Python比较有名的爬虫scrapy。网上搜到两篇相应的文档,一篇是较早版本的中文文档Scrapy 0.24 文档,一篇是当前最新文档Scrapy 1.3 documentation,建议还是看最新的英文文档比较好。 scrap 阅读全文