TNTsc

2019年6月5日

摘要：一.Series 对象(一维数组) 1.创建 ①使用列表创建 ②使用numpy 创建 ③使用字典创建 2.索引和切片 ①索引 ②切片 3.基本概念 ①添加数据 ②查看属性 ③查值示例: ④去重 4.Series的运算 ①运算示例: ②可以使用pd.isnull()，pd.notnull()，或阅读全文

posted @ 2019-06-05 20:41 TNTsc 阅读(253) 评论(0) 推荐(0) 编辑

数据分析 --- 01. Numpy

摘要：一.创建 1. 使用np.array() 创建 ①一维数据创建 ②二维数组创建 2.使用np 的 routlines 函数创建 ①np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None) 等差数列 ②np.a 阅读全文

posted @ 2019-06-05 16:37 TNTsc 阅读(223) 评论(0) 推荐(0) 编辑

2019年6月4日

爬虫 --- 08. 全站爬取(CrawlSpider), 分布式, 增量式爬虫

摘要：一.全站爬取(CrawlSpider) 1.基本概念 2.项目示例 ①.爬取抽屉网多页数据对象 ②爬取阳光热线多页及详情页数据,持久化存储二.分布式 1.基本概念 2.实现流程 3.示例(阳光热线的爬取): 三.增量式爬虫 1.对url去重(爬取4567电影网数据) 2.对数据的去重(糗事百科) 阅读全文

posted @ 2019-06-04 19:19 TNTsc 阅读(1252) 评论(0) 推荐(0) 编辑

2019年6月3日

爬虫 --- 07. 全站爬取(手动), post请求,cookie, 传参,中间件,selenium

摘要：一.全站数据的爬取(手动) 二.如何进行post请求发送和cookie处理 1.post请求的发送 2.cookie的处理三.请求传参四.中间件 1.UA池和代理池代理池:ip代理 - 作用：尽可能多的将scrapy工程中的请求的IP设置成不同的。 ①在middlewares.py 文件中阅读全文

posted @ 2019-06-03 20:46 TNTsc 阅读(613) 评论(0) 推荐(0) 编辑

2019年6月1日

数据结构 --- 02. 内存, 顺序表, 单链表

摘要：一.内存 1.基本概念二.顺序表 1.单数据类型 2.多类型数据结构三.单链表 1.基本操作 2.代码结构阅读全文

posted @ 2019-06-01 18:37 TNTsc 阅读(199) 评论(0) 推荐(0) 编辑

数据结构 --- 01. 时间复杂度,timeit模块,栈,队列,双端队列

摘要：一.时间复杂度 1.基本概念 O(1) < O(logn) < O(n) < O(nlogn) < O(n^2) < O(n^3) < O(2^n) < O(n!) < O(n^n) 2.示例说明 ① ② ③三种不同数据结构的时间复杂度二.timeit(测试代码执行的平均值) 三. 栈 1.基本操阅读全文

posted @ 2019-06-01 18:20 TNTsc 阅读(664) 评论(0) 推荐(0) 编辑

2019年5月31日

爬虫 --- 06. scrapy框架初始,移动端数据爬取

摘要：一.基本概念二. 环境的安装 Linux系统： pip3 install scrapy 三. 使用流程四.基本结构: 爬虫文件示例: 五.持久化存储 1.基于终端指令存储 2.基于管道的持久化存储 setting配置文件中六.移动端数据的爬取阅读全文

posted @ 2019-05-31 18:36 TNTsc 阅读(627) 评论(0) 推荐(0) 编辑

2019年5月30日

爬虫 --- 05. 异步协程, 浏览器自动化,

摘要：一.单线程+异步协程 1.基本概念: 2.多任务异步协程 3.在爬虫中的应用 from flask import Flask import time app = Flask(__name__) @app.route('/bobo') def index_bobo(): time.sleep(2) r 阅读全文

posted @ 2019-05-30 21:57 TNTsc 阅读(472) 评论(0) 推荐(0) 编辑

2019年5月29日

爬虫 --- 04. 代理服务器, 验证码识别, 处理cookie,线程池

摘要：一.代理服务器 1.基本概念 2.示例二.验证码识别以下代码是下载的文件中的内容用的时候需加载三.处理cookie 四.综合示例(验证码,模拟登陆,cookie) 五.线程池的使用阅读全文

posted @ 2019-05-29 22:36 TNTsc 阅读(498) 评论(0) 推荐(0) 编辑

2019年5月28日

爬虫 --- 02. 爬取图片,数据解析

摘要：一.两种爬取图片的方法 ①requests方法 ②request方法二.数据解析 1.正则 2. bs4解析 ①环境安装 ②原理 ③定位 ‘>’:表示一个层级 soup.select('.tang > ul > li > a') 空格：表示多个层级 soup.select('.tang a') ④ 阅读全文

posted @ 2019-05-28 20:08 TNTsc 阅读(1079) 评论(0) 推荐(0) 编辑

公告