模块

模块

time模块

import time

# 1、time() -> float 返回当前时间的时间戳(1970纪元后经过的浮点秒数
print(time.time())

# 2、sleep() -> None 睡眠n秒
time.sleep(1)


# 3、asctime() -> string 接受时间元组并返回一个可读的形式的字符串格式的时间
print(time.asctime(time.localtime()))   #  Sun May 21 17:31:37 2023

# 4、ctime() ->  string 作用相当于asctime(localtime(secs)),未给参数相当于asctime()
print(time.ctime()) # Sun May 21 17:33:36 2023

# localtime() -> 结构化格式的时间
print(time.localtime(time.time()))
# time.struct_time(tm_year=2023, tm_mon=5, tm_mday=21, tm_hour=17, tm_min=35, tm_sec=17, tm_wday=6, tm_yday=141, tm_isdst=0)

# strftime(format,t) -> string 将结构化时间转换为字符串2023-05-21 17:36:38
time1 = time.strftime('%Y-%m-%d %H:%M:%S',time.localtime())
print(time1)

# strptime(time,format) -> struct time,将字符转化为格式化时间
time1 = '2023-05-21 17:36:38'
time1 = time.strptime(time1,'%Y-%m-%d %H:%M:%S')
print(time1)
# time.struct_time(tm_year=2023, tm_mon=5, tm_mday=21, tm_hour=17, tm_min=36, tm_sec=38, tm_wday=6, tm_yday=141, tm_isdst=-1)


# mktime() -> 将结构化时间转化为秒
print(time.mktime(time.localtime()))    # 1684661991.0


import datetime
print(datetime.datetime.today())

random模块

import random

# random() -> x in the interval [0, 1), 随机生成一个0到1之间的小数,包含0但包含1
print(random.random())

# randint(a,b) -> x in the interal[1,2],随机生成一个1到2之间的整数,包含1和2
print(random.randint(1, 2))

# randrange(start,stop=None,step=1) -> x in the [1,3),随机身材1个1到3之间的整数,包含1但不包含3
print(random.randrange(1, 3))

# choice(seq) -> value 随机生成某个值
print(random.choice([1, 2]))

# sample(seq) -> list,随机生成多个不重复的值
print(random.sample([1, 2, 3, 4, 5], 2))

# 练习:生成5位的字母和数字的组合,并且不重复
num = random.sample([i for i in range(10)] + [chr(j) for j in range(65, 91)], 5)
num1 = [i for i in map(lambda x:str(x),num)]
print(''.join(num1))

os模块

import  os

 1、getcwd() -> string 获取当前脚本的工作目录
 print(os.getcwd())   		  C:\Users\Administrator\PycharmProjects\fullstack\week2\day18

 2、os.curdir -> string 返回当前目录.
 print(os.curdir)     .

 3、os.pardir -> string 获取当前目录的父目录
 print(os.pardir)     ..

 4、chdir(path) -> 修改当前脚本的工作目录
 os.chdir(r'C:\Users')
 print(os.getcwd())   C:\Users

 5、mkdir(path) -> None 创建单个目录,目录存在时报错
 os.mkdir('aaa')
 os.mkdir('aaa\\bbb')


 6、rmdir(path) -> None 删除一个空目录,目录不存在或不为空报错
 os.rmdir('bbb')

 7、remove(path) -> None 删除一个文件
 os.remove('aaa\\aaa.txt.py')

 8、makedirs(path) -> None 递归创建目录,目录存在时报错
 os.makedirs(r'aaa\bbb\ccc')

 9、removedirs(path) -> 递归删除空目录,目录不存在时报错
 os.removedirs(r'aaa\bbb\ccc')

 10、listdir(path) -> list 查看目录下的所有内容
 files = os.listdir(r'..\..')
 print(files)


 11、stat(path) -> 获取文件或目录的信息
 st = os.stat(os.getcwd())
 print(st.st_size)  获取文件或目录的大小


 12、重命名文件或目录
 os.rename('os模块.py','os模块_修改.py')


 13、sep :输出操作系统下特定的路径分割符,windows下为\\,linux下为/
 print(os.sep)    \

 14、linesep:输出当前平台下的行分割符,windows下为\r\n,linux下为\n,mac下为\r
 print(os.linesep)

 15、pathsep:路径分隔符,windows下为; linux下为:
 print(os.pathsep)

 16、name:输出字符串所表示的当前系统平台
 print(os.name)   nt


 17、system(命令) : 执行shell命令
 os.system('calc')


 18、environ:获取系统环境变量
 print(os.environ)

 19、abspath(path) -> 获取绝对路径
 print(os.path.abspath(__file__))


 20、spilt(path) -> 将path分割成目录和文件名二元组返回
 print(os.path.split(__file__))   ('C:/Users/Administrator/PycharmProjects/fullstack/week2/day18', 'os模块_修改.py')


 21、dirname(path) -> 返回path的目录,其实就是os.path.spilt(path) 的第一个元素
 print(os.path.dirname(__file__))     C:/Users/Administrator/PycharmProjects/fullstack/week2/day18


 22、basename(path) - > 返回path最后的文件名,,其实就是os.path.spilt(path) 的第二个元素
 print(os.path.basename(__file__))    os模块_修改.py


 23、exists(path) -> 判断path是否存在
 print(os.path.exists(__file__))  True
 print(os.path.exists('aaa'))     False


 24、判断是否是绝对路径
 print(os.path.isabs(os.getcwd()))   True
 print(os.path.isabs('.'))    False


 25、isfile(path) -> 判断是否是文件
 print(os.path.isfile('os模块_修改.py'))  True

 26、isdir(path) -> 判断是否是目录
 print(os.path.isdir(os.path.dirname(__file__)))  True



 27、getctime(path) -> 获取文件或目录的最后访问时间
 print(os.path.getatime(__file__))    1685233847.2652798


 28、getmtime(path) -> 获取文件或目录的最后修改时间
 print(os.path.getmtime(__file__))    1685243886.4732845


 29、join(sep) -> 路径拼接
 print(os.path.join(os.getcwd(),'aaa.txt'))   C:\Users\Administrator\PycharmProjects\fullstack\week2\day18\aaa.txt

sys模块

import sys

 1、argv -> 命令行参数list,第一个元素为程序本省路径
 print(sys.argv)


 2、exit() -> 退出程序,正常退出用exit(0)
 print(sys.exit(0))


 3、path -> 返回模块的搜索路径,初始化时使用python中path的路径
 print(sys.path)


 4、version -> 返回python环境变量的版本信息
 print(sys.version)


 5、stdout -> 标准输出
 print(sys.stdout.write('fasdfas'))


 6、platform -> 返回操作系统平台信息
 print(sys.platform)

hashlib模块

# 用于加密相关的操作,3.x里代替了md5模块和sha模块,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法
import hashlib

# MD5加算法
hash = hashlib.md5()
hash.update(b'hello worlld')
print(hash.digest())  # 二进制格式的hash值
print(hash.hexdigest())  # 十六进制格式的hash值

# SHA1加密算法
hash = hashlib.sha1()
hash.update(b'hello world')
print(hash.hexdigest())  # 十六进制格式的hash值

logging模块

一、简单应用

import logging

logging.debug('logger debug message')
logging.info('logger info message')
logging.warning('logger warning message')
logging.error('logger error message')
logging.critical('logger critical message')


输出结果如下:
WARNING:root:logger warning message
ERROR:root:logger error message
CRITICAL:root:logger critical message

可见,默认情况下python的logging模块输出到了标准输出中,且只显示了大于等于warning的日志,这说明默认的日志级别设置成了warning,日志级别等级critical>error>warning>info>debug,默认日志输出格式为:日志级别、logger名称、日志信息

二、灵活配置日志级别,日志格式,输出位置

import logging

logging.basicConfig(level=logging.DEBUG,
					format='%(asctime)s - %(filename)s[line:%(lineno)d] - %(levelname)s - %(message)s',
					datefmt='%Y-%m-%d %H%M%S',
					filename='test.txt',
					filemode='a'
					)

logging.debug('logger debug message')
logging.info('logger info message')
logging.warning('logger warning message')
logging.error('logger error message')
logging.critical('logger critical message')

可见在logging.basicConfig()函数中可通过具体参数来更改logging模块默认行为,可用参数有
filename:用指定的文件名创建FiledHandler(后边会具体讲解handler的概念),这样日志会被存储在指定的文件中。
filemode:文件打开方式,在指定了filename时使用这个参数,默认值为“a”还可指定为“w”。
format:指定handler使用的日志显示格式。
datefmt:指定日期时间格式。
level:设置rootlogger(后边会讲解具体概念)的日志级别
stream:用指定的stream创建StreamHandler。可以指定输出到sys.stderr,sys.stdout或者文件(f=open('test.log','w')),默认为sys.stderr。若同时列出了filename和stream两个参数,则stream参数会被忽略


format参数中可能用到的格式化串:
%(name)s Logger的名字
%(levelno)s 数字形式的日志级别
%(levelname)s 文本形式的日志级别
%(pathname)s 调用日志输出函数的模块的完整路径名,可能没有
%(filename)s 调用日志输出函数的模块的文件名
%(module)s 调用日志输出函数的模块名
%(funcName)s 调用日志输出函数的函数名
%(lineno)d 调用日志输出函数的语句所在的代码行
%(created)f 当前时间,用UNIX标准的表示时间的浮 点数表示
%(relativeCreated)d 输出日志信息时的,自Logger创建以 来的毫秒数
%(asctime)s 字符串形式的当前时间。默认格式是 “2003-07-08 16:49:45,896”。逗号后面的是毫秒
%(thread)d 线程ID。可能没有
%(threadName)s 线程名。可能没有
%(process)d 进程ID。可能没有
%(message)s用户输出的消息

三、logger对象

上述几个例子中我们了解到了logging.debug()、logging.info()、logging.warning()、logging.error()、logging.critical()(分别用以记录不同级别的日志信息),logging.basicConfig()(用默认日志格式(Formatter)为日志系统建立一个默认的流处理器(StreamHandler),设置基础配置(如日志级别等)并加到root logger(根Logger)中)这几个logging模块级别的函数,另外还有一个模块级别的函数是logging.getLogger([name])(返回一个logger对象,如果没有指定名字将返回root logger)

 先看一个最简单的过程:
 import logging

# 创建一个logger对象
logger = logging.getLogger('log1')

# 创建一个handler对象,用于输出到日志文件中
fh = logging.FileHandler('test.txt')
# 创建一个handler对象,用于输出到屏幕
sh = logging.StreamHandler()

# 设置日志的输出格式
formatter = logging.Formatter(fmt='%(asctime)s - %(name)s - %(levelname)s - %(message)s')

# 设置输出到日志的格式
fh.setFormatter(formatter)
# 设置输出到拼命的格式
sh.setFormatter(formatter)

# 将操作对象添加到logger中
logger.addHandler(fh)
logger.addHandler(sh)

logger.debug('logger debug message')
logger.info('logger info message')
logger.warning('logger warning message')
logger.error('logger error message')
logger.critical('logger critical message')


 先简单介绍一下,logging库提供了多个组件:Logger、Handler、Filter、Formatter。Logger对象提供应用程序可直接使用的接口,Handler发送日志到适当的目的地,Filter提供了过滤日志信息的方法,Formatter指定日志显示格式。

(1)
Logger是一个树形层级结构,输出信息之前都要获得一个Logger(如果没有显示的获取则自动创建并使用root Logger,如第一个例子所示)。
  logger = logging.getLogger()返回一个默认的Logger也即root Logger,并应用默认的日志级别、Handler和Formatter设置。
当然也可以通过Logger.setLevel(lel)指定最低的日志级别,可用的日志级别有logging.DEBUG、logging.INFO、logging.WARNING、logging.ERROR、logging.CRITICAL。
Logger.debug()、Logger.info()、Logger.warning()、Logger.error()、Logger.critical()输出不同级别的日志,只有日志等级大于或等于设置的日志级别的日志才会被输出。

输出结果:
2023-06-03 12:04:29,372 - log - WARNING - logger warning message
2023-06-03 12:04:29,372 - log - ERROR - logger error message
2023-06-03 12:04:29,372 - log - CRITICAL - logger critical message

 从这个输出可以看出logger = logging.getLogger()返回的Logger名为root。这里没有用logger.setLevel(logging.Debug)显示的为logger设置日志级别,所以使用默认的日志级别WARNIING,故结果只输出了大于等于WARNIING级别的信息。

 (2) 如果我们再创建两个logger对象:
import logging

# 创建一个logger对象
logger = logging.getLogger()
logger1 = logging.getLogger('mylogger')
logger2 = logging.getLogger('mylogger')

logger1.setLevel(logging.DEBUG)
logger2.setLevel(logging.INFO)

# 创建一个handler对象,用于输出到日志文件中
fh = logging.FileHandler('test.txt')
# 创建一个handler对象,用于输出到屏幕
sh = logging.StreamHandler()

# 设置日志的输出格式
formatter = logging.Formatter(fmt='%(asctime)s - %(name)s - %(levelname)s - %(message)s')

# 设置输出到日志的格式
fh.setFormatter(formatter)
# 设置输出到拼命的格式
sh.setFormatter(formatter)

# 将操作对象添加到logger中
logger.addHandler(fh)
logger.addHandler(sh)

logger1.addHandler(fh)
logger1.addHandler(sh)


logger2.addHandler(fh)
logger2.addHandler(sh)



logger.debug('logger debug message')
logger.info('logger info message')
logger.warning('logger warning message')
logger.error('logger error message')
logger.critical('logger critical message')

logger1.debug('logger1 debug message')
logger1.info('logger1 info message')
logger1.warning('logger1 warning message')
logger1.error('logger1 error message')
logger1.critical('logger1 critical message')

logger2.debug('logger2 debug message')
logger2.info('logger2 info message')
logger2.warning('logger2 warning message')
logger2.error('logger2 error message')
logger2.critical('logger2 critical message')


输出结果:

2023-06-03 12:20:09,816 - root - WARNING - logger warning message
2023-06-03 12:20:09,817 - root - ERROR - logger error message
2023-06-03 12:20:09,817 - root - CRITICAL - logger critical message
2023-06-03 12:20:09,817 - mylogger - INFO - logger1 info message
2023-06-03 12:20:09,817 - mylogger - INFO - logger1 info message
2023-06-03 12:20:09,817 - mylogger - WARNING - logger1 warning message
2023-06-03 12:20:09,817 - mylogger - WARNING - logger1 warning message
2023-06-03 12:20:09,817 - mylogger - ERROR - logger1 error message
2023-06-03 12:20:09,817 - mylogger - ERROR - logger1 error message
2023-06-03 12:20:09,817 - mylogger - CRITICAL - logger1 critical message
2023-06-03 12:20:09,817 - mylogger - CRITICAL - logger1 critical message
2023-06-03 12:20:09,817 - mylogger - INFO - logger2 info message
2023-06-03 12:20:09,817 - mylogger - INFO - logger2 info message
2023-06-03 12:20:09,817 - mylogger - WARNING - logger2 warning message
2023-06-03 12:20:09,817 - mylogger - WARNING - logger2 warning message
2023-06-03 12:20:09,817 - mylogger - ERROR - logger2 error message
2023-06-03 12:20:09,817 - mylogger - ERROR - logger2 error message
2023-06-03 12:20:09,818 - mylogger - CRITICAL - logger2 critical message
2023-06-03 12:20:09,818 - mylogger - CRITICAL - logger2 critical message


这里有两个个问题:

  <1>我们明明通过logger1.setLevel(logging.DEBUG)将logger1的日志级别设置为了DEBUG,为何显示的时候没有显示出DEBUG级别的日志信息,而是从INFO级别的日志开始显示呢?

   原来logger1和logger2对应的是同一个Logger实例,只要logging.getLogger(name)中名称参数name相同则返回的Logger实例就是同一个,且仅有一个,也即name与Logger实例一一对应。在logger2实例中通过logger2.setLevel(logging.INFO)设置mylogger的日志级别为logging.INFO,所以最后logger1的输出遵从了后来设置的日志级别。

  <2>为什么logger1、logger2对应的每个输出分别显示两次?
   这是因为我们通过logger = logging.getLogger()显示的创建了root Logger,而logger1 = logging.getLogger('mylogger')创建了root Logger的孩子(root.)mylogger,logger2同样。而孩子,孙子,重孙……既会将消息分发给他的handler进行处理也会传递给所有的祖先Logger处理。

    ok,那么现在我们把

# logger.addHandler(fh)

# logger.addHandler(ch)  注释掉,我们再来看效果
![image](https://img2023.cnblogs.com/blog/3091017/202306/3091017-20230603122312930-639877302.png)
因为我们注释了logger对象显示的位置,所以才用了默认方式,即标准输出方式。因为它的父级没有设置文件显示方式,所以在这里只打印了一次。

孩子,孙子,重孙……可逐层继承来自祖先的日志级别、Handler、Filter设置,也可以通过Logger.setLevel(lel)、Logger.addHandler(hdlr)、Logger.removeHandler(hdlr)、Logger.addFilter(filt)、Logger.removeFilter(filt)。设置自己特别的日志级别、Handler、Filter。若不设置则使用继承来的值。

<3>Filter
限制只有满足过滤规则的日志才会输出。
比如我们定义了filter = logging.Filter('a.b.c'),并将这个Filter添加到了一个Handler上,则使用该Handler的Logger中只有名字带          a.b.c前缀的Logger才能输出其日志。
import logging

# 创建一个logger
logger = logging.getLogger()

logger1 = logging.getLogger('mylogger')
logger1.setLevel(logging.DEBUG)

logger2 = logging.getLogger('mylogger')
logger2.setLevel(logging.INFO)

logger3 = logging.getLogger('mylogger.child1')
logger3.setLevel(logging.WARNING)

logger4 = logging.getLogger('mylogger.child1.child2')
logger4.setLevel(logging.DEBUG)

logger5 = logging.getLogger('mylogger.child1.child2.child3')
logger5.setLevel(logging.DEBUG)

# 创建一个handler,用于写入日志文件
fh = logging.FileHandler('test.txt')

# 再创建一个handler,用于输出到控制台
ch = logging.StreamHandler()

# 定义handler的输出格式formatter
formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
fh.setFormatter(formatter)
ch.setFormatter(formatter)

# 定义一个filter
filter = logging.Filter('mylogger.child1')
fh.addFilter(filter)

# 给logger添加handler
logger.addFilter(filter)
logger.addHandler(fh)
logger.addHandler(ch)

logger1.addFilter(filter)
logger1.addHandler(fh)
logger1.addHandler(ch)

logger2.addHandler(fh)
logger2.addHandler(ch)

logger3.addFilter(filter)
logger3.addHandler(fh)
logger3.addHandler(ch)

logger4.addFilter(filter)
logger4.addHandler(fh)
logger4.addHandler(ch)

logger5.addHandler(fh)
logger5.addHandler(ch)

# 记录一条日志
logger.debug('logger debug message')
logger.info('logger info message')
logger.warning('logger warning message')
logger.error('logger error message')
logger.critical('logger critical message')

logger1.debug('logger1 debug message')
logger1.info('logger1 info message')
logger1.warning('logger1 warning message')
logger1.error('logger1 error message')
logger1.critical('logger1 critical message')

logger2.debug('logger2 debug message')
logger2.info('logger2 info message')
logger2.warning('logger2 warning message')
logger2.error('logger2 error message')
logger2.critical('logger2 critical message')

logger3.debug('logger3 debug message')
logger3.info('logger3 info message')
logger3.warning('logger3 warning message')
logger3.error('logger3 error message')
logger3.critical('logger3 critical message')

logger4.debug('logger4 debug message')
logger4.info('logger4 info message')
logger4.warning('logger4 warning message')
logger4.error('logger4 error message')
logger4.critical('logger4 critical message')

logger5.debug('logger5 debug message')
logger5.info('logger5 info message')
logger5.warning('logger5 warning message')
logger5.error('logger5 error message')
logger5.critical('logger5 critical message')

configParser模块

来看一个好多软件的常见文档格式如下:
[DEFAULT]
ServerAliveInterval = 45
Compression = yes
CompressionLevel = 9
ForwardX11 = yes

[bitbucket.org]
User = hg

[topsecret.server.com]
Port = 50022
ForwardX11 = no

import configparser

如果想用python生成一个这样的文档怎么做呢?
config = configparser.ConfigParser()

config['DEFAULT'] = {
	'ServerAliveInterval':45,
	'Compression':'yes',
	'CompressionLevel':9
}

config['bitbucket.org'] = {}
config['bitbucket.org']['User'] = 'hg'

config['topsecret.server.com'] = {}
config['topsecret.server.com']['Port'] = '50022'
config['topsecret.server.com']['ForwardX11'] = 'no'

config.write(open('example.ini','w'))

config.write(open('example.ini','w',encoding='utf-8'))



配置文件的增删改查操作:
import configparser

config = configparser.ConfigParser()
config.read('example.ini')

# 获取所有最外层的key
for key in config:  # DEFAULT、bitbucket.org、topsecret.server.com
	print(key)

print(config.default_section)  # DEFAULT 获取默认的key
print(config.sections())  # ['bitbucket.org', 'topsecret.server.com'],获取除默认key之外的key

# 根据key获取值
print(config['DEFAULT']['serveraliveinterval'])  # 45
print(config['bitbucket.org']['User'])  # hg

# 添加第一、二层的key
config['userinfo'] = {'name': '张三'}
config.write(open('example.ini', 'w', encoding='utf-8'))

# 根据第一层的key删除元素
config.remove_section('userinfo')
config.write(open('example.ini', 'w', encoding='utf-8'))

# 根据第二层的key删除元素
config.remove_option('topsecret.server.com', 'Port')
config.write(open('example.ini', 'w', encoding='utf-8'))

# 修改第二层的key对应的value值
config.set('topsecret.server.com', 'forwardx11', 'yes')
config.write(open('example.ini', 'w', encoding='utf-8'))

re模块

1、re模块介绍

就其本质而言,正则表达式是一种小型的 ,高度专业化的编程语言,在内嵌在python中,并通过re模块实现,正则表达式模式被编译成一系列的字节码,然后用C编写的匹配引擎执行,

2、元字符

import re


# 1、元字符之. ^ $ * + ? { }

# '.' : 默认匹配除\n之外的人一个字符,若指定flags=re.DOTALL,则换行父也能匹配上
print(re.findall('w...d','hello world'))    # ['world']
print(re.findall('w..d','hello w\nd'))    # []
print(re.findall('w.d','hello w\nd',flags=re.DOTALL))    # ['w\nd']

# '^' : 匹配字符串以什么开头
print(re.findall('^hello','hello world'))    # ['hello']
print(re.findall('^he1llo','hello world'))    # [']


# '$' : 匹配以什么结尾
print(re.findall('world$','hello world'))    # ['world']
print(re.findall('world$','hello world1'))    # ['']


# '*' : 匹配*前的字符0次或多次
print(re.findall('wo*','hello worldwoow'))  # ['wo', 'woo', 'w']


# '+' : 匹配+前的字符1次或多次
print(re.findall('wo+','hello worldwoow'))  # ['wo', 'woo']

# '?' : 匹配?前的字符0次或1次
print(re.findall('wo?','hello worldwoow'))  # ['wo', 'wo', 'w']

# '{m}' : 匹配前一个字符m次
print(re.findall('w{2}','hello worldwwoow'))    # ['ww']

# '{m,n}': 匹配前一个字符m到n次
print(re.findall('w{1,2}','hello worldwwoow'))    # ['w', 'ww', 'w']


# 元字符之字符集[],取消元字符的特殊功能(-、^、\)
print(re.findall('[A,B]',','))  # [','],匹配[]之中的字符
print(re.findall('[1-9a-zA-Z]','1aD$ %')) # ['1', 'a', 'D'] 匹配所有的字母和数字
print(re.findall('[^1-9a-zA-Z]','1aD$ %')) # ['$', ' ', '%'] 匹配所有的非字母和数字
print(re.findall('\d[-+*\\\\]\d',r'3+5,3-5,3*5,3\5'))    # ['3+5', '3-5', '3*5', '3\\5']


# 元字符之转义符\
'''
1、反斜杠后面跟元字符去除特殊功能如 \.
2、反斜杠后面跟普通字符实现特殊功能,如 \d
'''

# \d: 匹配任何十进制数
print(re.findall('\d[a-z]\d','3a34aa4'))    # ['3a3']

# \D: 匹配任何的非十进制数
print(re.findall('\D[a-z]\D','3a34aa4ffdsfas3rr'))    # ['ffd', 'sfa']

# \s: 匹配任何空白字符,如:[ \t\n\r\f\v]
print(re.findall('\s[a-z]','aa    fdf$\nf\tb')) # [' f', '\nf', '\tb']


# \S: 匹配任何空白字符,如:[^\t\n\r\f\v]
print(re.findall('\S[a-z]','aa    fdf$\nf\tb')) # ['aa', 'fd']


# \w: 匹配任何字母、数字、字符,相当于[0-9a-zA-Z]
print(re.findall('\w[0-9]','aa3,A4'))   # ['a3', 'A4']

# \W: 匹配任何非字母、数字字符,相当于[^0-9z-zA-Z]
print(re.findall('\W[0-9]','aa¥3,A,4'))   # ['¥3', ',4']

# \b: 匹配一个特殊边界字符,比如空格,&,#等,因为\b在python有特殊意义,所以需要转义
print(re.findall(r'[a-z]\b','a ,a(ff'))


# 现在我们聊一聊\,先看下面两个匹配
# ret=re.findall('c\l','abc\le') # 报错
# ret=re.findall('c\\l','abc\le') # 报错
print(re.findall('c\\\\l','abc\le')) # ['c\\l']
print(re.findall(r'c\\l','abc\le')) # ['c\\l']


#之所以选择\b是因为\b在ASCII表中是有意义的
m = re.findall('\bblow', 'blow')
print(m)    # []
m = re.findall(r'\bblow', 'blow')
print(m)    # ['blow']



# 元字符之分组()
print(re.search('icore-bdas.paic.(com.)*cn','icore-bdas.paic.com.cn').group())   # icore-bdas.paic.com.cn
print(re.search('icore-bdas.paic.(com.)*cn','icore-bdas.paic.cn').group())   # icore-bdas.paic.com.cn
ret = re.search('(?P<id>\w{3})/(?P<name>\d{3})','www/3333')
print(ret.group('id'))  # www
print(ret.group('name'))    # 333


# 元字符之|
print(re.search('(com|cn)\d{1,3}','com33').group()) # com33

# 注意:前面的*,+,?等都是贪婪匹配,也就是尽可能匹配,后面加?号使其变成惰性匹配
ret = re.findall('abc*?', 'abcccccc')
print(ret)  # ['ab']

ret = re.findall('abc*', 'abcccccc')
print(ret)  # ['abcccccc']

3、re模块下常用的方法

posted @ 2023-05-21 17:12  duuuu  阅读(9)  评论(0编辑  收藏  举报