会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
PingY
博客园
::
首页
::
新随笔
::
联系
::
订阅
::
管理
公告
2016年11月4日
python:爬虫
摘要: 模块: (1)url管理器:对url进行管理 (2)网页下载器(urllib2):将需要爬取的url指定的网页以字符串的形式下载下来 (3)网页解释器(BeautifulSoup):解析 利用urllib2下载网页的方法: 方法1: 方法2: 方法3: 网页解释器种类: (1)正则表达式 (2)ht
阅读全文
posted @ 2016-11-04 16:02 PingY
阅读(248)
评论(0)
推荐(0)
编辑