会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Lovebugs的小园子
Keep Thinking
博客园
首页
新随笔
联系
订阅
管理
2017年7月6日
Python开发简单爬虫(一)
摘要: 一 、简单爬虫架构: 爬虫调度端:启动爬虫,停止爬虫,监视爬虫运行情况 URL管理器:对将要爬取的和已经爬取过的URL进行管理;可取出带爬取的URL,将其传送给“网页下载器” 网页下载器:将URL指定的网页下载,存储成一个字符串,在传送给“网页解析器” 网页解析器:解析网页可解析出 ①有价值的数据
阅读全文
posted @ 2017-07-06 14:46 Lovebugs.cn
阅读(1106)
评论(1)
推荐(3)
编辑
公告