Fork me on GitHub
摘要: 整理之前的学习笔记,看的某视频的记录 爬虫:自己取抓取互联网上的信息的程序。 爬虫价值:爬取数据 爬虫的架构 爬虫调度段:启动爬虫,监视爬虫 URL管理器: 网页下载器(urllib) 网页解析器(BeautifulSoup) 运行的流程 URL管理器:管理待抓取URL集合和已经抓取URL集合 防止 阅读全文
posted @ 2018-07-10 20:28 TaoTao~ 阅读(154) 评论(0) 推荐(0) 编辑