摘要: 一、Scrapy介绍 Scrapy,Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。 Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫 阅读全文
posted @ 2018-06-21 09:58 Jack-- 阅读(211) 评论(0) 推荐(0) 编辑
摘要: 网络通用库: urllib -网络库(stdlib)。requests -网络库。grab – 网络库(基于pycurl)。pycurl – 网络库(绑定libcurl)。urllib3 – Python HTTP库,安全连接池、支持文件post、可用性高。httplib2 – 网络库。RoboBr 阅读全文
posted @ 2018-06-21 09:45 Jack-- 阅读(3369) 评论(0) 推荐(1) 编辑