摘要: 一、快速排序算法步骤:(从小到大排序) 1. 在数组中选一个基准数(通常为数组第一个); 2. 将数组中小于基准数的数据移到基准数左边,大于基准数的移到右边; 3. 对于基准数左、右两边的数组,不断重复以上两个过程,直到每个子集只有一个元素,即为全部有序。 实例演示 这个算法就是先找一个基准,对着一 阅读全文
posted @ 2020-01-10 18:05 kongbursi 阅读(730) 评论(0) 推荐(0) 编辑
摘要: 一、堆排序 1、部分概念 满二叉树:深度为k,且含有(2^k)-1个结点的二叉树 完全二叉树:深度为k的,又n个结点的,当且仅当其每一个节点都与深度为k的满二叉树种编号从1至n的节点一一对应时,称为完全二叉树 堆的结构可以分为大根堆和小根堆,是一个完全二叉树 每个结点的值都大于其左孩子和右孩子结点的 阅读全文
posted @ 2020-01-10 17:41 kongbursi 阅读(1835) 评论(0) 推荐(0) 编辑
摘要: 上一篇博客地址:python代理池的构建4——mongdb数据库的增删改查 一、对数据库里面代理ip检查(proxy_test.py) #-*-coding:utf-8-*- ''' 目的:检查代理IP可用性,保证代理池中代理IP基本可用 思路 1.在proxy. _test.py中, 创建Prox 阅读全文
posted @ 2020-01-10 10:23 kongbursi 阅读(429) 评论(0) 推荐(0) 编辑
摘要: 上一篇博客地址:python代理池的构建3——爬取代理ip 一、mongdb数据库的增删改查(Mongo_pool.py) #-*-coding:utf-8-*- ''' 实现代理池的数据库模块 ●作用:用于对proxies 集合进行数据库的相关操作 目标:实现对数据库增删改查相关操作步骤: 1.在 阅读全文
posted @ 2020-01-10 09:51 kongbursi 阅读(291) 评论(0) 推荐(0) 编辑
摘要: 上篇博客地址:python代理池的构建2——代理ip是否可用的处理和检查 一、基础爬虫模块(Base_spider.py) #-*-coding:utf-8-*- ''' 目标: 实现可以指定不同URL列表,分组的XPATH和详情的XPATH,从不同页面上提取代理的IP,端口号和区域的通用爬虫; 步 阅读全文
posted @ 2020-01-10 09:41 kongbursi 阅读(749) 评论(0) 推荐(0) 编辑