07 2017 档案

摘要:对于一个URL https://zhuanlan.zhihu.com/xmucpp (1)首先浏览器解析出主机名:http://zhuanlan.zhihu.com (2)浏览器搜索出相应主机的ip地址(DNS) (3)浏览器解析出相应的端口号 (4)建立与主机及特定端口的联系 (5)发送请求报文( 阅读全文
posted @ 2017-07-24 20:25 御虫师 阅读(306) 评论(0) 推荐(0) 编辑
摘要:re 正则表达式操作 本模块提供了类似于Perl的正则表达式匹配操作。要匹配的模式和字符串可以是Unicode字符串以及8位字符串。 正则表达式使用反斜杠字符('\')来表示特殊的形式或者来允许使用特殊的字符而不要启用它们特殊的含义。这与字符串字面值中相同目的的相同字符的用法冲突;例如,要匹配一个反 阅读全文
posted @ 2017-07-21 09:16 御虫师 阅读(1349) 评论(0) 推荐(0) 编辑
摘要:1. Process 2. Lock 3. Semaphore 4. Event 5. Queue 6. Pipe 7. Pool 1. Process 2. Lock 3. Semaphore 4. Event 5. Queue 6. Pipe 7. Pool 序. multiprocessing 阅读全文
posted @ 2017-07-14 16:42 御虫师 阅读(149) 评论(0) 推荐(0) 编辑
摘要:软件架构设计的目的简单说就是在保持软件内在联系的前提下,分解软件系统,降低软件系统开发的复杂性,而分解软件系统的基本方法无外乎分层和分割。但是在保持软件内在联系的前提下,如何分层分割系统,分层分割到什么样的力度,并不是一件容易的事,这方面有各种各样的分解方法,比如:关注点分离,面向方面,面向对象,面 阅读全文
posted @ 2017-07-12 10:57 御虫师 阅读(404) 评论(0) 推荐(0) 编辑
摘要:0x00 网络 1)通用 urllib -网络库(stdlib)。 requests -网络库。 grab – 网络库(基于pycurl)。 pycurl – 网络库(绑定libcurl)。 urllib3 – Python HTTP库,安全连接池、支持文件post、可用性高。 httplib2 – 阅读全文
posted @ 2017-07-11 18:59 御虫师 阅读(353) 评论(0) 推荐(0) 编辑
摘要:Python 爬虫的工具列表 Python 爬虫的工具列表 0x00 网络 1)通用 urllib -网络库(stdlib)。 requests -网络库。 grab – 网络库(基于pycurl)。 pycurl – 网络库(绑定libcurl)。 urllib3 – Python HTTP库,安 阅读全文
posted @ 2017-07-11 18:58 御虫师 阅读(275) 评论(0) 推荐(0) 编辑
摘要:1 控制浏览器 Selenium 主要提供的是操作页面上各种元素的方法,但它也提供了操作浏览器本身的方法,比如浏览器的大小以及浏览器后退、前进按钮等。 1.1 控制浏览器窗口大小 在不同的浏览器大小下访问测试站点,对测试页面截图并保存,然后观察或使用图像比对工具对被测页面的前端样式进行评测。比如可以 阅读全文
posted @ 2017-07-10 16:13 御虫师 阅读(1910) 评论(0) 推荐(0) 编辑
摘要:总是记不住API。昨晚写的时候用到了这些,但是没记住,于是就索性整理一下吧: python中对文件、文件夹(文件操作函数)的操作需要涉及到os模块和shutil模块。 得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd() 返回指定目录下的所有文件和目录名:os.listd 阅读全文
posted @ 2017-07-03 15:30 御虫师 阅读(165) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示