摘要: 网络爬虫的基本工作流程例如以下: 1.选取种子URL; 2.将这些URL放入待抓取URL队列; 3.从待抓取URL队列中取出待抓取在URL。解析DNS,而且得到主机的ip,并将URL相应的网页下载下来,存储进已下载网页库中。 4.分析已抓取URL队列中的URL,分析当中的其它URL,而且将URL放入 阅读全文
posted @ 2019-03-05 20:38 男神鹏●詹姆斯 阅读(462) 评论(0) 推荐(0) 编辑