摘要: BeautifulSoup4库 和lxml一样,Beautiful Soup也是一个HTML/XML的解析器,主要的功能也是如何解析和提取 HTML/XML数据。lxml只会局部遍历,而Beautiful Soup是基于HTMLDOM的,会载入整个文档,解析整个DOM树,因此时间和内存开销都会大很多 阅读全文
posted @ 2018-10-09 16:16 cmap 阅读(352) 评论(0) 推荐(0) 编辑
摘要: 1.豆瓣 爬取单个页面数据 2.电影天堂 爬取多个页面数据 3.腾讯招聘 跟上一个电影天堂的代码差不多 阅读全文
posted @ 2018-10-09 16:03 cmap 阅读(254) 评论(0) 推荐(0) 编辑