Python 正则表达式
摘要:一、re模块 re模块是Python标准库,直接导入即可。 re模块官方文档:https://docs.python.org/zh-cn/3.8/library/re.html 正则表达式语法 一个正则表达式(或RE)指定了一集与之匹配的字符串;模块内的函数可以让你检查某个字符串是否跟给定的正则表达
阅读全文
pandas 常用函数
摘要:pandas常用的100个实用函数,这些函数大致可以分为六类,分别是统计汇总函数、数据清洗函数、数据筛选、绘图与元素级运算函数、时间序列函数和其他函数。 统计汇总函数 数据分析过程中,必然要做一些数据的统计汇总工作,那么对于这一块的数据运算有哪些可用的函数可以帮助到我们呢?具体看如下几张表。 数据清
阅读全文
jupyter 数据显示设置
摘要:#设置显示行数pd.set_option('display.max_row',None)#设置显示列数pd.set_option('display.max_column',None)#设置显示宽度pd.set_option('display.width',1000)#显示小数位数pd.set_opt
阅读全文
posted @
2022-11-10 09:52
坚持_学习
阅读(769)
推荐(0) 编辑
Python matplotlib 学习——建立画布和坐标系
摘要:#导入包import matplotlib.pyplot as plt #让图表在jupyter展示出来%matplotlib inline#解决中文乱码问题plt.rcParams["font.sans-serif"]='SimHei'#解决负号无法显示plt.rcParams["axes.uni
阅读全文
posted @
2022-11-01 11:45
坚持_学习
阅读(1332)
推荐(0) 编辑
MVT模型与MVC模型的区别
摘要:1. MVC设计模式 MVC 是 Model-View-Controller 的缩写,其中每个单词都有其不同的含义: Modle 代表数据存储层,是对数据表的定义和数据的增删改查; View 代表视图层,是系统前端显示部分,它负责显示什么和如何进行显示; Controller 代表控制层,负责根据从
阅读全文
posted @
2022-08-02 11:02
坚持_学习
阅读(484)
推荐(0) 编辑
前后端分离
摘要:下图是前后端分离模型,通过此模型可更好的理解爬虫破解。 爬虫在爬取数据时,因为获得的不是页面显示的数据,所以无法提取想要的信息。因为前后端分离了,我们向后端服务器发送请求后,返回的不是html源码,而是json数据,由json数据向WEB服务器请求静态资源,WEB服务器再把数据发给浏览器渲染。所以在
阅读全文
posted @
2022-08-01 17:21
坚持_学习
阅读(63)
推荐(0) 编辑
python md5撞库解密
摘要:import hashlibwith open('md5.txt', 'w') as f: print('正在写入。。。') for i in range(0, 999999): md5 = hashlib.md5(str(i).encode()).hexdigest() + '\n' f.writ
阅读全文
python 闭包
摘要:python 闭包的实现方法 注:使用闭包的过程中,一旦外函数被调用一次返回了内函数的引用,虽然每次调用内函数,是开启一个函数执行过后消亡,但是闭包变量实际上只有一份,每次开启内函数都在使用同一份闭包变量。
阅读全文
python安装清华源
摘要:pip install pip -Upip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple# "pip install pip -U" 是用于执行升级pip的命令;
阅读全文
posted @
2022-07-26 16:14
坚持_学习
阅读(385)
推荐(0) 编辑
提高python异步效率
摘要:uvloop #Python标准库中提供了asyncio模块,用于支持基于协程的异步编程。 #uvloop是 asyncio 中的事件循环的替代方案,替换后可以使得asyncio性能提高。事实上,uvloop要比nodejs、gevent等其他python异步框架#至少要快2倍,性能可以比肩Go语言
阅读全文
posted @
2022-07-26 16:13
坚持_学习
阅读(89)
推荐(0) 编辑
异步爬虫测试
摘要:#!/usr/bin/env python# -*- coding:utf-8 -*-import aiofilesimport aiohttpimport asyncio#控制并发的数量sem = asyncio.Semaphore(3)async def fetch(session, url):
阅读全文
posted @
2022-07-26 14:59
坚持_学习
阅读(52)
推荐(0) 编辑
python 异步写入文件
摘要:# -*- coding:utf-8 -*-import asyncioimport aiofilesimport time#异步操作时,函数名前必须加上asyncasync def func1(): #异步写入文件 async with aiofiles.open("text.txt","a",e
阅读全文
posted @
2022-07-26 13:52
坚持_学习
阅读(1537)
推荐(0) 编辑
python socket练习
摘要:此端(服务端)先接收信息,先启用此服务 from socket import * #定义socket类型,网络通信,UDP(TCP为SOCK_STREAM)s = socket(AF_INET,SOCK_DGRAM)#绑定IP和端口s.bind(("",8788)) while True: #接收U
阅读全文
posted @
2022-07-21 10:20
坚持_学习
阅读(31)
推荐(0) 编辑
变量的作用域
摘要:在python中变量的作用域,以一个函数为一个作用域。函数中无变量的会从全局中找。全局中的变量可以用在局部,局部的不能用到全局。局部和全局好比父与子的关系。
阅读全文
关键字break和continue
摘要:关键字:break 和continue提供了另一种控制循环的方式。 break 是直接退出循环体 如: continue 是退出当前循环迭代 如: 需要注意的是:使用过多的break和continue将使程序难以读懂
阅读全文
posted @
2021-01-18 15:35
坚持_学习
阅读(59)
推荐(0) 编辑
逻辑运算符
摘要:练习:判断是否为闰年 year=eval(input("请输入年份:"))pd=Trueif year%400==0: pd=Trueelif year%4==0 and year%100!=0: pd = Trueelse: pd=Falseif pd==True: print(str(year)
阅读全文
posted @
2021-01-07 16:09
坚持_学习
阅读(50)
推荐(0) 编辑
三元运算和lambda表达式
摘要:1、三元运算 三元运算是为了解决简单的if else语句,如: 正常if else的写法是: 三元运算可以写成: 即: 条件成立时执行的语句+"if"+条件+"else"+条件不成立时执行的语句 原先需要写4行代码,用三元运算只要一行代码就行。 2、lambda表达式 lambda表达式是为了解决简
阅读全文
posted @
2020-12-31 08:30
坚持_学习
阅读(507)
推荐(0) 编辑