摘要:
urllib库的使用 urllib库是Python内置的HTTP请求库,它包含了4个模块: request:最基本的HTTP请求模块,用来模拟发送请求 error:异常处理模块。出现请求错误后,我们可以捕获异常,然后进行下一步的操作。 parse:工具模块。提供了很多URL处理方法。 robotpa 阅读全文
摘要:
作为初学者,看了好多资料没能理解API的意思,这篇博客让我醍醐灌顶,给大家分享一下。 https://blog.csdn.net/LJH_Gemini/article/details/86551799 阅读全文
摘要:
最近读到崔庆才大神的Python3网络爬虫开发实战,本文基本上是书中的内容,有小的改动,仅供参考,如有侵权请联系删除。 爬虫基础 1.HTTP基本原理 1.URI和URL URL的全称是Uniform Resource Locator,即统一资源定位符,又叫做网页地址,是互联网上标准的资源的地址。 阅读全文
摘要:
正则表达式:正则表达式是一种对字符串操作的逻辑表达式,用来对字符串进行筛选和匹配 构成:正则表达式由元字符和普通字符构成,普通字符包含字母,数字,特殊符号,遇到普通字符直接写就可以匹配了,遇到转义字符需要\\去转义 重点在元字符,元字符才是正则表达式的灵魂 优缺点: 优点:灵活,功能性强,逻辑性强 阅读全文
摘要:
栈是一种数据结构,如图: 在python中没有栈,所以我们要自己动手写一个栈 栈的特点:INLO 先进后出 栈可以类似于你放一个容器中放东西,最先放入的东西在最底下,最后放入的东西在最上边,所以我们要想拿东西,最先拿到的是最后放进入的,最后拿到的是最先放进去的 栈的最基本功能: 1.出栈(往容器中放 阅读全文
摘要:
在python中,时间一共有三种形式: 1.时间戳 给机器看的 时间戳是以浮点数的形式显示,以1970-01-01 00:00:00为原点,慢慢往后加数形成的 2.格式化时间 给人看的 3.结构化时间 用来计算的 格式化时间是,我们可以采取不从的格式让时间显示不同的样式,下边是日期格式化的标准,我们 阅读全文
摘要:
import random #random.random() 生成0-1之间随机的一个小数 print(random.random()) #random.uniform(a,b) 生成a-b之间随机的一个小数 print(random.uniform(1,20)) #random.randint(a,b) 生成a-b之间随机的一个整数 print(random.randint(1,50))... 阅读全文
摘要:
单一文件日志处理: 多文件日志处理 阅读全文
摘要:
import hashlib #引入模块 obj = hashlib.md5() #创建对象,可以在这里通过加入字节来防止撞库 obj.update(加密内容.encode("UTF-8")) val = obj.hexdigest() print(val) #拿到密文 阅读全文
摘要:
在程序中出现了多个类的继承而且出现了菱形继承,并且又要用到super,知道MRO就显得极为重要,我们使用C3算法来计算MRO 下面通过例子来解释: 我们来计算上述代码的MRO 1.首先把继承树图画出来 是这样子的(不太好看,凑合一下) 2.假设C3算法是一个函数式,继承代表相加,然后把函数式写出来, 阅读全文