摘要: 项目需求:爬取100个百度百科网络爬虫词条以及相关词条的标题、摘要和链接等信息。 架构设计:爬虫调度器、URL管理器、HTML下载器、HTML解析器和数据存储器。 阅读全文
posted @ 2017-11-23 09:02 pop_PY 阅读(145) 评论(0) 推荐(0) 编辑