摘要:
Spider基本上能做很多事情了,但是如果你想爬取全站的话,可能需要一个更强大的武器。CrawlSpider基于Spider,但是可以说是为全站爬取而生。CrawlSpiders是Spider的派生类,Spider类的设计原则是只爬取start_url列表中的网页,而CrawlSpider类定义了一 阅读全文
摘要:
df -h 由 df 命令显示出的各列信息的含义分别是: Filesystem:表示该文件系统位于哪个分区,因此该列显示的是设备名称; 1K-blocks:此列表示文件系统的总大小,默认以 KB 为单位; Used:表示用掉的硬盘空间大小; Available:表示剩余的硬盘空间大小; Use%:硬 阅读全文
摘要:
简介 top命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器。 top显示系统当前的进程和其他状况,是一个动态显示过程,即可以通过用户按键来不断刷新当前状态.如果在前台执行该命令,它将独占前台,直到用户终止该程序为止. 比较准确的说,t 阅读全文
摘要:
可以看到,info的输出结果是分几块的,有Servers、Clients、Memory等等,通过info后面接这些参数,可以指定输出某一块数据。 我刚开始在Gentoo上装的默认版本2.4.10,并没有分块输出,都是挤到一堆,而且也无法按上面说的加选项控制输出某一块,后来升级到2.6.7和2.6.8的版本,都报 Segment Fault 段错误,找了半天没法解决,也在Gentoo... 阅读全文
摘要:
一、用xlrd和xlwt读写excel 首先下载安装xlrd和xlwt这两个库。 1、打开excel readbook = xlrd.open_workbook(r'\test\canying.xlsx') 2、获取读入的文件的sheet sheet = readbook.sheet_by_inde 阅读全文
摘要:
一 什么是Selenium selenium 是一套完整的web应用程序测试系统,包含了测试的录制(selenium IDE),编写及运行(Selenium Remote Control)和测试的并行处理(Selenium Grid)。 Selenium的核心Selenium Core基于JsUni 阅读全文
摘要:
该模块提供了堆排序算法的实现。堆是二叉树,最大堆中父节点大于或等于两个子节点,最小堆父节点小于或等于两个子节点。 创建堆 heapq有两种方式创建堆, 一种是使用一个空列表,然后使用heapq.heappush()函数把值加入堆中,另外一种就是使用heap.heapify(list)转换列表成为堆结 阅读全文
摘要:
DButils DButils是python的一个实现数据库连接池的模块 两种模式: 1.为每一个线程创建一个链接,即使线程即使调用了close()方法,也不会关闭,只是把线程放到连接池,供自己再次使用,当连接关闭时,线程连接自动关闭。 1 from DBUtils.PersistentDB imp 阅读全文
摘要:
db first 根据数据库的表生成类 django : python manage.py inspectdb code first 根据类创建数据库表; django: python manage.py makemigrations python manage.py migrate 配置数据库 s 阅读全文
摘要:
转自:https://www.cnblogs.com/liuyinzhou/p/9769490.html 引入 对于flask而言,其请求过程与django有着截然不同的流程。在django中是将请求一步步封装最终传入视图函数的参数中,但是在flask中,视图函数中并没有请求参数,而是将请求通过上下 阅读全文