爬虫相关 - 随笔分类 - —super—

selenium

摘要：一介绍官网：http://selenium-python.readthedocs.io 二安装 #安装：selenium+chromedriver pip3 install selenium 下载chromdriver.exe放到python安装路径的scripts目录中即可，注意最新版本是2 阅读全文

posted @ 2017-12-22 09:49 —super— 阅读(264) 评论(0) 推荐(0)

scrapy

摘要：Scrapy Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。其可以应用在数据挖掘，信息处理或存储历史数据等一系列的程序中。其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的，也可以应用在获取API所返回的数据(例如 Amazon Associates Web Ser 阅读全文

posted @ 2017-12-13 19:20 —super— 阅读(222) 评论(0) 推荐(0)

爬虫

摘要：requests Python标准库中提供了：urllib、urllib2、httplib等模块以供Http请求，但是，它的 API 太渣了。它是为另一个时代、另一个互联网所创建的。它需要巨量的工作，甚至包括各种方法覆盖，来完成最简单的任务。 Requests 是使用 Apache2 License 阅读全文

posted @ 2017-12-12 18:47 —super— 阅读(165) 评论(0) 推荐(0)

—super—

公告

随笔分类 - 爬虫相关