2018 年 10月 9 日随笔档案 - cmap

2018年10月9日

摘要： BeautifulSoup4库和lxml一样，Beautiful Soup也是一个HTML/XML的解析器，主要的功能也是如何解析和提取 HTML/XML数据。lxml只会局部遍历，而Beautiful Soup是基于HTMLDOM的，会载入整个文档，解析整个DOM树，因此时间和内存开销都会大很多阅读全文

posted @ 2018-10-09 16:16 cmap 阅读(352) 评论(0) 推荐(0) 编辑

lxml爬取实验

摘要： 1.豆瓣爬取单个页面数据 2.电影天堂爬取多个页面数据 3.腾讯招聘跟上一个电影天堂的代码差不多阅读全文

posted @ 2018-10-09 16:03 cmap 阅读(254) 评论(0) 推荐(0) 编辑

cmap

公告