python 爬虫学习

一、python 爬虫的简单架构

     爬虫由上图三个模块循环,网页解析器除了产生有价值的数据外,还将新爬取到的URL加入到URL管理器中!

二、简单python 爬虫的架构的动态运行流程

 

 

 

 

 

 

 

 

 

 

 使用pip安装beautifulsoup4

 

posted @ 2017-05-14 10:53  胡卫雄  阅读(233)  评论(0编辑  收藏  举报