2018 年 9月 30 日随笔档案 - 小黑_9527

2018年9月30日

摘要：一、BeautifulSoup BeautifulSoup简介简单来说，Beautiful Soup是python的一个库，最主要的功能是从网页抓取数据。官方解释如下： Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档阅读全文

posted @ 2018-09-30 11:16 小黑_9527 阅读(427) 评论(0) 推荐(0) 编辑

爬虫系列之第3章-Selenium模块

摘要：简介 selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题 selenium本质是通过驱动浏览器，完全模拟浏览器的操作，比如跳转、输入、点击、下拉等，来拿到网页渲染之后的结果，可支持多种浏览器安装 1 下载驱动 if ma 阅读全文

posted @ 2018-09-30 11:16 小黑_9527 阅读(261) 评论(0) 推荐(0) 编辑

爬虫系列之第1章-简介&requests模块

摘要：概述近年来，随着网络应用的逐渐扩展和深入，如何高效的获取网上数据成为了无数公司和个人的追求，在大数据时代，谁掌握了更多的数据，谁就可以获得更高的利益，而网络爬虫是其中最为常用的一种从网上爬取数据的手段。网络爬虫，即Web Spider，是一个很形象的名字。如果把互联网比喻成一个蜘蛛网，那么Spi 阅读全文

posted @ 2018-09-30 11:15 小黑_9527 阅读(425) 评论(0) 推荐(0) 编辑

公告