python基础-re模块

 import re
 
# 1.从一个字符串中提取到所以的数字
lst = re.findall('\d+', "fajhdsjk123kjfakl123213")
print(lst)  # 返回的是一个列表
 
# 2.判断一句话是否有数字
# search的特点：匹配字符串，匹配到第一个结果就返回，不会匹配出多个结果来
res = re.search('\d+', "fajhdsjk123kjfakl123213")
print(res.group())
 
# 3.finditer ,所有的数据都会进行匹配，返回的是迭代器
it = re.finditer('\d+', "fajhdsjk123kjfakl123213")
for item in it:
    print(item.group())
 
# 4.match 匹配，从头开始匹配 ^
result = re.match('\d+', "123kjfakl123213")
print(result.group())
 
# 切割 返回一个列表，先对’你‘进行分割一次，再对’的‘进行切割一次
result = re.split("[你的]", "你好，18岁先生，我是16岁的你")
print(result, type(result))
 
# 替换 返回字符串
result = re.sub("\d+", '__hi__', "你好，18岁先生，我是16岁的你")
print(result, type(result))
 
# 替换并统计次数 返回元组
result = re.subn("\d+", '__hi__', "你好，18岁先生，我是16岁的你")
print(result, type(result))
 
# 先加载这个正则，后面可以直接使用这个正则来匹配内容
# 返回列表
obj = re.compile('\d+')
lst = obj.findall("你好，18岁先生，我是16岁的你")
print(lst)
 
# 爬虫必会的一个重点
# 正则表达式中经常出现的\n,为了避免这类问题出现，
# 可以在字符串前面写上r来直接把字符串中的内容全部当成普通字符来处理
# 1.()括起来的内容是你最终想要的结果
# 2.(?P<name>正则) 把正则匹配到的内容直接放在name组里面，后面取数据的时候直接group(name)
# re.S:让.能匹配换行符
 
# 例一：
obj = re.compile(r'hnzy.bfvvs.com\\/play\\/(?P<m3u8_url>.*?)\\/index.m3u8', re.S)
m3u8_url = +obj.search(resp.text).group('m3u8_url')
 
# 例二：
obj = re.compile(r'中午我要吃(?P<mian>\d+)碗饭再喝(?P<xian>\d+)碗汤',re.S)
# print(r'fasd\nfakl;s')
result = obj.finditer("早上我要是1个包子，中午我要吃1碗饭再喝2碗汤，晚上吃2包方便面")
for item in result:
    # print(item.group("mian"))
    # print(item.group("xian"))
    print(item.groupdict())
 
# findall: 匹配所有，返回列表
# finditer: 匹配所有，返回迭代器
# search: 匹配到一个结果就返回
# match:从头匹配，得到一个结果就返回
 
# group: 拿到数据的。
# group(组名)
 
# re.compile() 预编译
 
# ()从正则匹配到的结果中拿到指定数据

posted @ 2023-02-26 23:12 0x1e61 阅读(32) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· python基础-迭代器

· python基础-生成器

· Python-re模块

· 【python】re模块

· python---re

公告

昵称： 0x1e61
园龄： 4年8个月
粉丝： 3
关注： 2

+加关注

2025年3月

日

一

二

三

四

五

六

随笔分类

随笔档案

阅读排行榜

评论排行榜

1. HCIA基本命令(1)

0x1e61

python基础-re模块

公告

搜索

常用链接

最新随笔

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

	import re

	# 1.从一个字符串中提取到所以的数字
	lst = re.findall('\d+', "fajhdsjk123kjfakl123213")
	print(lst) # 返回的是一个列表

	# 2.判断一句话是否有数字
	# search的特点：匹配字符串，匹配到第一个结果就返回，不会匹配出多个结果来
	res = re.search('\d+', "fajhdsjk123kjfakl123213")
	print(res.group())

	# 3.finditer ,所有的数据都会进行匹配，返回的是迭代器
	it = re.finditer('\d+', "fajhdsjk123kjfakl123213")
	for item in it:
	print(item.group())

	# 4.match 匹配，从头开始匹配 ^
	result = re.match('\d+', "123kjfakl123213")
	print(result.group())

	# 切割返回一个列表，先对’你‘进行分割一次，再对’的‘进行切割一次
	result = re.split("[你的]", "你好，18岁先生，我是16岁的你")
	print(result, type(result))

	# 替换返回字符串
	result = re.sub("\d+", '__hi__', "你好，18岁先生，我是16岁的你")
	print(result, type(result))

	# 替换并统计次数返回元组
	result = re.subn("\d+", '__hi__', "你好，18岁先生，我是16岁的你")
	print(result, type(result))

	# 先加载这个正则，后面可以直接使用这个正则来匹配内容
	# 返回列表
	obj = re.compile('\d+')
	lst = obj.findall("你好，18岁先生，我是16岁的你")
	print(lst)

	# 爬虫必会的一个重点
	# 正则表达式中经常出现的\n,为了避免这类问题出现，
	# 可以在字符串前面写上r来直接把字符串中的内容全部当成普通字符来处理
	# 1.()括起来的内容是你最终想要的结果
	# 2.(?P<name>正则) 把正则匹配到的内容直接放在name组里面，后面取数据的时候直接group(name)
	# re.S:让.能匹配换行符

	# 例一：
	obj = re.compile(r'hnzy.bfvvs.com\\/play\\/(?P<m3u8_url>.*?)\\/index.m3u8', re.S)
	m3u8_url = +obj.search(resp.text).group('m3u8_url')

	# 例二：
	obj = re.compile(r'中午我要吃(?P<mian>\d+)碗饭再喝(?P<xian>\d+)碗汤',re.S)
	# print(r'fasd\nfakl;s')
	result = obj.finditer("早上我要是1个包子，中午我要吃1碗饭再喝2碗汤，晚上吃2包方便面")
	for item in result:
	# print(item.group("mian"))
	# print(item.group("xian"))
	print(item.groupdict())

	# findall: 匹配所有，返回列表
	# finditer: 匹配所有，返回迭代器
	# search: 匹配到一个结果就返回
	# match:从头匹配，得到一个结果就返回

	# group: 拿到数据的。
	# group(组名)

	# re.compile() 预编译

	# ()从正则匹配到的结果中拿到指定数据