08 2017 档案

摘要:在学习使用scrapy爬虫框架之前,需要了解一些基础原理 我们知道HTTP请求是基于socket模块进行发送和接受的,但是socket套接字的在使用的中存在着阻塞,不利用爬虫的高性能运行,所以我们就需要对框架进行一些高性能设置,使用select模块,检测socket请求的IO操作,实现对socket 阅读全文
posted @ 2017-08-31 22:23 左岸边 阅读(978) 评论(0) 推荐(0)
摘要:一,回顾操作系统的概念 操作系统位于底层硬件与应用软件之间的一层 工作方式:向下管理软件,向上提供接口 二,进程线程的概念 进程是一个资源单位,线程是一个最小的执行单位 一个线程只能属于一个进程,而一个进程可以有多个线程,但至少有一个线程 三,并行与并发 并行: 就是有多个进程可以同时运行的叫做并行 阅读全文
posted @ 2017-08-26 22:12 左岸边 阅读(136) 评论(0) 推荐(0)
摘要:正则是用一些特殊含义的符号组合到一起来描述字符或者字符串的方法。python中内置了re模块。 贪婪匹配与非贪婪匹配 findall :默认为贪婪匹配,就是会匹配字符中所有符合正则条件的结果 当在正则使用?时:例如 :re.findall(a.*?b,aqddddddddda1b) 结果为:aqb 阅读全文
posted @ 2017-08-24 17:30 左岸边 阅读(186) 评论(0) 推荐(0)
摘要:示例代码: 这样做的目的是在其他模块引入后,不会执行两次函数 阅读全文
posted @ 2017-08-23 18:48 左岸边 阅读(121) 评论(0) 推荐(0)
摘要:os模块是解释器与操作系统的交互模块,使用os模块 阅读全文
posted @ 2017-08-22 19:57 左岸边 阅读(251) 评论(0) 推荐(0)
摘要:冒泡排序: 快速排序: 选择排序: 阅读全文
posted @ 2017-08-06 22:21 左岸边 阅读(394) 评论(0) 推荐(0)