Python--爬虫 - 文章分类 - 刘清政

Scrapy框架

摘要：一介绍 Scrapy一个开源和协作的框架，其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的，使用它可以以快速、简单、可扩展的方式从网站中提取所需的数据。但目前Scrapy的用途十分广泛，可用于如数据挖掘、监测和自动化测试等领域，也可以应用在获取API所返回的数据(例如 Amazon As 阅读全文

posted @ 2019-01-13 01:36 刘清政阅读(923) 评论(0) 推荐(1) 编辑

Beautifulsoup模块

摘要：一 Beautifulsoup模块介绍 Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.你可能在寻找 Beautiful Sou 阅读全文

posted @ 2019-01-12 22:39 刘清政阅读(375) 评论(0) 推荐(0) 编辑

Requests模块

摘要：一 Requests模块简介官网链接：http://docs.python-requests.org/en/master/ 二基于GET请求 1、基本请求 2、带参数的GET请求->params 3、带参数的GET请求->headers #添加headers(浏览器会识别请求头,不加可能会被拒绝阅读全文

posted @ 2019-01-06 00:16 刘清政阅读(709) 评论(0) 推荐(0) 编辑

刘清政的博客

文章分类 - Python--爬虫

公告

随笔分类

随笔档案

文章分类

阅读排行榜

评论排行榜

最新评论