该文被密码保护。 阅读全文
posted @ 2018-12-05 17:48 JerryZao 阅读(0) 评论(0) 推荐(0) 编辑
摘要: 1、概述 爬虫,应该称为网络爬虫,也叫网页蜘蛛人,网络蚂蚁等 搜索引擎,就是网络爬虫的应用者 2、爬虫分类 通用爬虫: 常见就是搜索引擎,无差别的收集数据,存储,提交关键字,构建索引库,给用户提供搜索接口 爬取一般流程: 1、初始一批URL,将这些URL放到待爬的队列 2、从队列取出这些URL,通过 阅读全文
posted @ 2018-12-05 11:54 JerryZao 阅读(1162) 评论(1) 推荐(0) 编辑