杨洪涛

2019年6月3日

摘要： 15.scrapy中selenium的应用引入在通过scrapy框架进行某些网站数据爬取的时候，往往会碰到页面动态数据加载的情况发生，如果直接使用scrapy对其url发请求，是绝对获取不到那部分动态加载出来的数据值。但是通过观察我们会发现，通过浏览器进行url请求发送则会加载出对应的动态加载出阅读全文

posted @ 2019-06-03 21:32 杨洪涛阅读(133) 评论(0) 推荐(0) 编辑

14.UA池和代理池

摘要： 14.UA池和代理池今日概要 scrapy下载中间件 UA池代理池今日详情一.下载中间件先祭出框架图：下载中间件（Downloader Middlewares）位于scrapy引擎和下载器之间的一层组件。 - 作用：（1）引擎将请求传递给下载器过程中，下载中间件可以对请求进行一系列阅读全文

posted @ 2019-06-03 21:30 杨洪涛阅读(119) 评论(0) 推荐(0) 编辑

13.scrapy框架的日志等级和请求传参

摘要： 13.scrapy框架的日志等级和请求传参今日概要日志等级请求传参如何提高scrapy的爬取效率今日详情一.Scrapy的日志等级 - 在使用scrapy crawl spiderFileName运行程序时，在终端里打印输出的就是scrapy的日志信息。 - 日志信息的种类： ERROR 阅读全文

posted @ 2019-06-03 21:28 杨洪涛阅读(157) 评论(0) 推荐(0) 编辑

11.scrapy框架持久化存储

摘要： 11.scrapy框架持久化存储今日概要基于终端指令的持久化存储基于管道的持久化存储今日详情 1.基于终端指令的持久化存储保证爬虫文件的parse方法中有可迭代类型对象（通常为列表or字典）的返回，该返回值可以通过终端指令的形式写入指定格式的文件中进行持久化操作。执行输出指定格式进行存储阅读全文

posted @ 2019-06-03 21:27 杨洪涛阅读(176) 评论(0) 推荐(0) 编辑

12.scrapy框架之递归解析和post请求

摘要： 12.scrapy框架之递归解析和post请求今日概要递归爬取解析多页页面数据 scrapy核心组件工作流程 scrapy的post请求发送今日详情 1.递归爬取解析多页页面数据 - 需求：将糗事百科所有页码的作者和段子内容数据进行爬取切持久化存储 - 需求分析：每一个页面对应一个url，则s 阅读全文

posted @ 2019-06-03 21:27 杨洪涛阅读(102) 评论(0) 推荐(0) 编辑

10.scrapy框架简介和基础应用

摘要： 10.scrapy框架简介和基础应用今日概要 scrapy框架介绍环境安装基础使用今日详情一.什么是Scrapy？ Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架，非常出名，非常强悍。所谓的框架就是一个已经被集成了各种功能（高性能异步下载，队列，分布式，解析，持久化等）阅读全文

posted @ 2019-06-03 21:26 杨洪涛阅读(111) 评论(0) 推荐(0) 编辑

09.移动端数据爬取

摘要： 09.移动端数据爬取前言随着移动市场的火热，各大平台都陆陆续续的推出了自己的移动端APP来拉拢吸引和便捷其广大的用户。那么在移动端的平台当时势必会出现大量有价值的信息和数据，那这些数据我们是否可以去享用一下呢？那么接下来就进入我们的移动端APP数据的爬虫中来吧。今日概要 fiddler简介手阅读全文

posted @ 2019-06-03 21:24 杨洪涛阅读(112) 评论(0) 推荐(0) 编辑

2019年6月1日

8.基本数据结构-顺序表和链表

摘要： 8.基本数据结构-顺序表和链表一.内存 - 计算机的作用：对数据进行存储和运算。首先我们需要知道我们目前使用的计算机都是二进制的计算机，就以为着计算机只可以存储和运算二进制的数据。例如下载好的一部电影，该电影可以存储到计算机中，计算机中存储的是基于二进制的电影数据，然后我们可以通过相关的视频播放软阅读全文

posted @ 2019-06-01 17:44 杨洪涛阅读(227) 评论(0) 推荐(0) 编辑

7.Deque的应用案例-回文检查

摘要： 7.Deque的应用案例-回文检查 - 回文检测：设计程序，检测一个字符串是否为回文。 - 回文：回文是一个字符串，读取首尾相同的字符，例如，radar toot madam。 - 分析：该问题的解决方案将使用 deque 来存储字符串的字符。我们从左到右处理字符串，并将每个字符添加到 deque 阅读全文

posted @ 2019-06-01 17:43 杨洪涛阅读(207) 评论(0) 推荐(0) 编辑

6.基本数据结构-双端队列（Deque）

摘要： 6.基本数据结构-双端队列（Deque）一.双端队列（Deque） - 概念：deque（也称为双端队列）是与队列类似的项的有序集合。它有两个端部，首部和尾部，并且项在集合中保持不变。 - 特性：deque 特殊之处在于添加和删除项是非限制性的。可以在前面或后面添加新项。同样，可以从任一端移除现有阅读全文

posted @ 2019-06-01 17:42 杨洪涛阅读(206) 评论(0) 推荐(0) 编辑

公告