摘要: Infi-chu: http://www.cnblogs.com/Infi-chu/ 一、门户新闻业务: 1. 特点:网页一旦发布,再次改动网页内容的几率很低,新闻业务内容的静态化相对比较简单 2. 步骤: a. 程序要支持发布的内容有动态转成静态的功能。 b. 运营编辑人员发布新闻网页后,后台程序 阅读全文
posted @ 2018-04-25 14:54 Infi_chu 阅读(369) 评论(0) 推荐(0) 编辑
摘要: Infi-chu: http://www.cnblogs.com/Infi-chu/ 一、网络爬虫的尺寸: 1.小规模,数据量小,爬取速度不敏感,Requests库,爬取网页 2.中规模,数据规模较大,爬取速度敏感,Scrapy库,爬取网站 3.大规模,大规模,搜索引擎,爬取速度很关键,定制开发,爬 阅读全文
posted @ 2018-04-25 13:02 Infi_chu 阅读(939) 评论(1) 推荐(0) 编辑
摘要: Infi-chu: http://www.cnblogs.com/Infi-chu/ 一、URI、URL、URN、HTTP URI:统一资源标志符 URL:是URI的一个子集 URN:是URI的另一个子集,统一资源名称 HTTP协议: 超文本传输协议,是一个基于“请求与响应”模式的、无状态的引用层协 阅读全文
posted @ 2018-04-25 11:54 Infi_chu 阅读(804) 评论(0) 推荐(0) 编辑