摘要: 调度程序: 先建立五个模块 spider_main 爬虫的总调度程序 while循环加入异常处理 URL管理器的编写(UrlManager) Html_downloader模块 HtmlParse模块 Outputer 模块 阅读全文
posted @ 2017-05-18 20:48 胡卫雄 阅读(554) 评论(0) 推荐(0) 编辑