2016年11月4日
摘要: 模块: (1)url管理器:对url进行管理 (2)网页下载器(urllib2):将需要爬取的url指定的网页以字符串的形式下载下来 (3)网页解释器(BeautifulSoup):解析 利用urllib2下载网页的方法: 方法1: 方法2: 方法3: 网页解释器种类: (1)正则表达式 (2)ht 阅读全文
posted @ 2016-11-04 16:02 PingY 阅读(248) 评论(0) 推荐(0) 编辑