摘要: 1.0 threading 的join方法就是用来阻塞用的,可以阻塞主线程,等待所的子线程结束后,然后再运行后面的程序: 此时,会等t2运行完成后,才执行最后的print语句。 此时,只会运行完t1后,就会执行最后的print 2.0 threading 的daemon,当我们使用setDaemon 阅读全文
posted @ 2019-05-23 22:03 Rollo|St 阅读(251) 评论(0) 推荐(0) 编辑
摘要: 多线程实例: 共节省两秒时间,以最大的时间为准,小的时间就是省下来的时间。 IO密集型项目,多线程可以节省时间,像爬虫这样的项目 计算密集型项目,就是用C来代替python写。 或者可以是协和+多进程。 单线程实例: 阅读全文
posted @ 2019-05-23 21:32 Rollo|St 阅读(150) 评论(0) 推荐(0) 编辑
摘要: Command line tools:命令行工具 Scrapy是通过 scrapy 命令行工具进行控制的。 这里我们称之为 “Scrapy tool” 以用来和子命令进行区分。 对于子命令,我们称为 “command” 或者 “Scrapy commands”。 Scrapy 项目结构: scrap 阅读全文
posted @ 2019-05-23 16:50 Rollo|St 阅读(202) 评论(0) 推荐(0) 编辑
摘要: Scrapy: Scrapy使用了Twisted作为框架,Twisted有些特殊的地方是它是事件驱动的,并且比较适合异步的代码。对于会阻塞线程的操作包含访问文件、数据库或者Web、产生新的进程并需要处理新进程的输出(如运行shell命令)、执行系统层次操作的代码(如等待系统队列),Twisted提供 阅读全文
posted @ 2019-05-22 21:23 Rollo|St 阅读(208) 评论(0) 推荐(0) 编辑
摘要: Python3 正则表达式: 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. 字符串也有很多表达式,可以查找,替换,拆分: string提供的方法是完全匹配,正则表达式用来模糊匹配的。 元字符:“.”, “*” , “?”,"$", "+","|","\","^" 阅读全文
posted @ 2019-05-06 10:30 Rollo|St 阅读(134) 评论(0) 推荐(0) 编辑
摘要: Python sys模块 阅读全文
posted @ 2019-05-04 21:48 Rollo|St 阅读(104) 评论(0) 推荐(0) 编辑
摘要: hon os 模块提供了非常丰富的方法用来处理文件和目录。常用的方法如下表所示: 1.0 os.getcwd() os.getcwd() 方法用于返回当前工作目录 2.0 os.chdir() os.chdir() 方法用于改变当前工作目录到指定的路径。 path -- 要切换到的新路径。 3.0 阅读全文
posted @ 2019-05-04 20:44 Rollo|St 阅读(210) 评论(0) 推荐(0) 编辑
摘要: Python 列表生成式: x从range里面取元素,然后对x进行运算,生成列表 或者可以这样: 运算符可以是函数: 另一种赋值形式:要求一一对应,不然就报错。 Python 生成器:一边循环,一边计算的机制,叫作生成器 内存的效率 生成器就是一个可迭代对象!!! 生成器创建方式: 1.0 小括号的 阅读全文
posted @ 2019-05-04 13:02 Rollo|St 阅读(163) 评论(0) 推荐(0) 编辑
摘要: Python 装饰器: 阅读全文
posted @ 2019-05-04 08:54 Rollo|St 阅读(96) 评论(0) 推荐(0) 编辑
摘要: Python 闭包:Closure. 定义: python中的闭包从表现形式上定义(解释)为:如果在一个内部函数里,对在外部作用域(但不是在全局作用域)的变量进行引用,那么内部函数就被认为是闭包(closure). 闭包是由函数及其相关的引用环境组合而成的实体. 函 数是一等公民(First cla 阅读全文
posted @ 2019-05-03 21:55 Rollo|St 阅读(139) 评论(0) 推荐(0) 编辑