摘要: 简单爬虫框架: 爬虫调度器 -> URL管理器 -> 网页下载器(urllib2) -> 网页解析器(BeautifulSoup) -> 价值数据 Demo1: # coding:utf8 import urllib2,cookielib url = "https://www.baidu.com" 阅读全文
posted @ 2016-01-06 14:41 AbelSu 阅读(10781) 评论(2) 推荐(0) 编辑