会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
cmap
博客园
首页
新随笔
联系
订阅
管理
2018年10月9日
BeautifulSoup4库
摘要: BeautifulSoup4库 和lxml一样,Beautiful Soup也是一个HTML/XML的解析器,主要的功能也是如何解析和提取 HTML/XML数据。lxml只会局部遍历,而Beautiful Soup是基于HTMLDOM的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多
阅读全文
posted @ 2018-10-09 16:16 cmap
阅读(352)
评论(0)
推荐(0)
编辑
lxml爬取实验
摘要: 1.豆瓣 爬取单个页面数据 2.电影天堂 爬取多个页面数据 3.腾讯招聘 跟上一个电影天堂的代码差不多
阅读全文
posted @ 2018-10-09 16:03 cmap
阅读(254)
评论(0)
推荐(0)
编辑
公告