摘要:
Infi-chu: http://www.cnblogs.com/Infi-chu/ 一、网络爬虫的尺寸: 1.小规模,数据量小,爬取速度不敏感,Requests库,爬取网页 2.中规模,数据规模较大,爬取速度敏感,Scrapy库,爬取网站 3.大规模,大规模,搜索引擎,爬取速度很关键,定制开发,爬 阅读全文
摘要:
Infi-chu: http://www.cnblogs.com/Infi-chu/ 一、URI、URL、URN、HTTP URI:统一资源标志符 URL:是URI的一个子集 URN:是URI的另一个子集,统一资源名称 HTTP协议: 超文本传输协议,是一个基于“请求与响应”模式的、无状态的引用层协 阅读全文