随笔分类 - python3学习
摘要:前面我们讲过了urllib模块,知道他是用于网络请求的,这一节讲的requests还是用于网络请求的,只不过urllib是官方模块,而requests是第三方的模块。用过的人都说他才是’人类使用的’,哈哈,我也没觉得urllib有多么尿性啊!下面我们试着回归人类的生活吧。 这是第三方的模块,所以需要
阅读全文
摘要:python标准库中带有一个Queue模块,顾名思义,队列。该模块也衍生出一些基本队列不具有的功能。 我们先看一下队列的方法: put 存数据 get 取数据 empty 判断队列是否为空 qsize 显示队列中真实存在的元素长度 maxsize 最大支持队列长度 join 等到队列为空,该行语句下
阅读全文
摘要:pickle提供了一个简单的持久化功能。可以将对象以文件的形式存放在磁盘上。 基本接口: pickle.dump(obj, file, [,protocol]) 注解:将对象obj保存到文件file中去。 protocol为序列化使用的协议版本, 0:ASCII协议,所序列化的对象使用可打印的ASC
阅读全文
摘要:在爬虫的学习中,我们爬取网页信息之后就是对信息项匹配,这个时候一般是使用正则。但是在使用中发现正则写的不好的时候不能精确匹配(这其实是自己的问题!)所以就找啊找。想到了可以通过标签来进行精确匹配岂不是比正则要快。所以找到了lxml。 因为lxml是对xml格式的解析,支持html格式,而对于xml格
阅读全文
摘要:1.logging模块的使用非常简单,引入模块就可以使用。 import logging logging.debug('This is debug message') logging.info('This is info message') logging.warning('This is warn
阅读全文
摘要:这一篇我们来看文件读写操作。 打开和创建文件主要是open()函数: f = open(‘filename’,’r’) # 读模式 f = open(‘filename’,’w’) # 写模式 f = open(‘filename’,’a’) # 追加模式 f = open(‘filename’,’
阅读全文