好好爱自己!

请问这个「 (?<=<(\w+)>).*(?=<\/\1>) 」正则表达式是什么意思呢?


 (?<=<(\w+)>).*(?=<\/\1>)
----------------------------------------------------

正则表达式看懂的最好方法就是一步步分开解析:

1)以 '.*' 为分界,前面括号中的内容可以划分为 ‘?<=’ 和 ‘<(\w+)>’,其中‘<(\w+)>'表示匹配尖括号里面是字母、数字或下划线的内容,类似<span>,外面还要加个括号是要实现分组;而‘?<=’用到的是零宽断言语法,表示的是断定‘<(\w+)>’后面有或没有内容,而且与内容的间隔宽度为零。

2)再看' .* '后面的部分,括号里面的内容可以分为 ‘?=’ 和 ‘<(\/\1>’,其中‘?=’用零宽断言表示匹配‘<(\/\1>’前面的部分,而对于‘<(\/\1>’,‘\/’匹配‘/’符号,类似</span>,这里可能有些同学不太明白‘\1’是什么意思?这里用到的是捕获分组的思想,上述提到的‘<(\w+)>’外面加个小括号就表示一个分组,对于正则表达式的分组结果,索引 0表示匹配的整个内容,而1表示的是第1个子分组,所以这里的'\1'指向的就是前面的第一个分组‘<(\w+)>’,\2表示重复第2个子项,\n表示重复第n个子项;

3).* 就比较简单了,表示的是匹配 除了换行符意外的任意字符0次或多次。

综上,改表达式匹配的是类似html标签这种内容的,如<body>你好,正则!</body>

posted @   立志做一个好的程序员  阅读(12687)  评论(1编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 25岁的心里话
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现

不断学习创作,与自己快乐相处

点击右上角即可分享
微信分享提示