会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
AntzUhl
跟着感觉走,抓住梦的手
博客园
首页
新随笔
联系
订阅
管理
2017年12月3日
宽度优先遍历网络爬虫
摘要: 根据一个网页链接,爬取该网页下所有子网页链接,存入一个队列,再从子网页中爬取新的网页链接。 队列设计 LinkQueue : 待访问链接队列 : unVisitedUrl 已访问链接队列 : visitedUrl 所需实现的具体方法: 队列中取出一个链接 队列添加链接时判断待访问和已访问队列是否存在
阅读全文
posted @ 2017-12-03 13:22 AntzUhl
阅读(992)
评论(0)
推荐(0)
编辑
公告