—super—

博客园 首页 新随笔 联系 订阅 管理

随笔分类 -  爬虫相关

摘要:一 介绍 官网:http://selenium-python.readthedocs.io 二 安装 #安装:selenium+chromedriver pip3 install selenium 下载chromdriver.exe放到python安装路径的scripts目录中即可,注意最新版本是2 阅读全文
posted @ 2017-12-22 09:49 —super— 阅读(228) 评论(0) 推荐(0) 编辑

摘要:Scrapy Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 其可以应用在数据挖掘,信息处理或存储历史数据等一系列的程序中。其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的, 也可以应用在获取API所返回的数据(例如 Amazon Associates Web Ser 阅读全文
posted @ 2017-12-13 19:20 —super— 阅读(195) 评论(0) 推荐(0) 编辑

摘要:requests Python标准库中提供了:urllib、urllib2、httplib等模块以供Http请求,但是,它的 API 太渣了。它是为另一个时代、另一个互联网所创建的。它需要巨量的工作,甚至包括各种方法覆盖,来完成最简单的任务。 Requests 是使用 Apache2 License 阅读全文
posted @ 2017-12-12 18:47 —super— 阅读(151) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示