QRegExp类正则表达式

一、QRegExp简介

QRegExp类是QT中的正则表达式,由表达式、量词和断言组成。

主要有四个作用:有效性检查、查找、替换、字符串分割,具体如下。

(1)有效性检查,检查字符串是否满足一定要求。

(2)查找,提供了比QString类更强大的匹配模型。

(3)替换,对字符串内符合或不符合要求的字符串进行替换。

(4)字符串分割,将字符串所需的部分,使用正则表达式进行分割

二、元字符及通配模式

1.元字符

元字符是QRegExp中的一类正则表达式,它表示一个或多个常量表达式

元字符 作用 实例
. 匹配任意单个字符 1.2,可能是1后面跟任意字符,再跟2
^ 匹配字符串首 ^12,可以是123,但不能是312
$ 匹配字符串尾 12$,可以是312, 当不能是 123
[] 匹配括号内输入的任意字符 [123],可以为1、 2 或3
* 匹配任意数量的前导字符 1*2,可以为任意数量个1(甚至没有), 后面跟一个2
+ 匹配至少一个前导字符 1+2,必须为一个或多个1, 后跟一个2
? 匹配一个前导字符或为空 1?2,可以为2或者12

2.通配模式

QRegExp类支持通配符匹配,通配模式相比于RegExp更为简单
在通配模式下,只有?、、[]3个字符可以使用,它们的功能发生变化
通过QRegExp::setPatternSyntax(QRegExp::Wildcard)可以将元字符设置为通配模式
通配符 作用 实例
?匹配任意单个字符 1?2,可以为1,后面跟任意单个字符,再跟2
*匹配任意一个字符序列 1
2,可以为1, 后面跟任意数量的字符,再跟一个2
[]匹配一个定义的字符集合 [a-z]可以匹配 a到z之间任意一个字符; [^a]匹配除小写a以外的字符.

三、QRegExp构造和方法

1.默认构造函数

产生一个空的正则表达式对象,函数声明如下。
QRegExp();

2.模式构造函数

产生指定匹配模式的正则表达式对象,函数声明如下。
QRegExp(const QString &pattern, Qt::CaseSensitivity cs = Qt::CaseSensitive,PatternSyntax syntax = RegExp)

3. isValid() 函数

判断正则表达式是否合法,合法返回true,否则返回false。

QRegExp exp1("[a-z]");
bool valid=exp1.isValid();	//返回true
QRegExp exp1("[a-z");
bool valid=exp1.isValid();	//返回false

4. caseSensitivity() 函数

判断正则表达式是否大小写敏感。
Qt::CaseSensitivity caseSensitivity() const;

5. cap() 和capturedTexts() 函数

前者获得捕捉的每一项,index从1开始,后者则获得整个捕捉列表。

QString pattern() const;
QStringList capturedTexts() const;

6. indexIn() 函数

进行匹配,如果成功则返回index,不成功返回-1。
indexIn(const QString &str, int offset = 0, CaretMode caretMode = CaretAtZero) const;

7. exactMatch() 函数,

是否整串匹配,返回true或false。
exactMatch(const QString &str) const;

8. matchedLength() 函数

返回匹配的串的长度。
int matchedLength() const;

9. pattern() 函数

获得正则表达式本身。
QString pattern() const;

10.构造和方法实例

QRegExp类部分方法使用实例如下:

QRegExp expression;									//定义QRegExp 
expression.setPatternSyntax(QRegExp::RegExp);		//设置为RegExp模式
expression.setCaseSensitivity(Qt::CaseSensitive); 	//设置大小写敏感
expression.setPattern(QString("^[A-Za-z0-9]+$")); 	//匹配所有大小写字母和数字组成的字符串
QString s = "kojad@0123";							//定义字符串
expression.exactMatch(s); 							//返回的值为false,因为s中含有@字符

四、常用正则表达式实例

以下列出了一些正则表达式含义、常用写法,以及具体实例。

1.常用正则表达式及实例1

\r, \n 代表 回车和换行符

\t 制表符

\\ 代表 "\" 本身

\^ 匹配 ^ 符号本身

\$ 匹配 $ 符号本身

. 匹配除了换行符以外的任意字符

\w 匹配字母、数字、下划线、汉字

\s 匹配任意的空白符

\b 单词的开始或结尾  

\~ 匹配字符串的开始  

$ 匹配字符串的结束

[]  包含一系列字符

[^]  包含之外一系列字符

例1:"\ba\w*\b" ,匹配以字母a开头的单词,先是开始(\b),然后是字母a,然后是任意数量的字母或数字(\w*),最后是结束(\b).

例2:"\d+",匹配1个或更多连续的数字。+匹配重复1次或更多次.

例3:"\b\w{6}\b", 匹配刚好6个字符的单词.

例4:"[ab5@]": 匹配 "a" 或 "b" 或 "5" 或 "@".

例5:"[^abc]": 包含abc之外的任意字符.

例6:"[f-k]": f-k之间的任意字符.

2.常用正则表达式及实例2

{n} 表达式重复n次,比如:"\w{2}" 相当于 "\w\w";"a{5}" 相当于 "aaaaa".

{m,n} 表达式至少重复m次,最多重复n次,比如:"ba{1,3}"可以匹配 "ba"或"baa"或"baaa".

{m,} 表达式至少重复m次,比如:"\w\d{2,}"可以匹配 "a12","_456","M12344".

? 表达式0次或者1次,相当于 {0,1},比如:"a[cd]?"可以匹配 "a","ac","ad"

+ 表达式至少出现1次,相当于 {1,},比如:"a+b"可以匹配 "ab","aab","aaab".  

* 表达式不出现或出现任意次,相当于 {0,},比如:"\^*b"可以匹配 "b","^^^b".

例1:"\w{2}"相当于 "\w\w";"a{5}" 相当于 "aaaaa".

例2:"ba{1,3}"可以匹配 "ba"或"baa"或"baaa".

例3:"\w\d{2,}"可以匹配 "a12","_456","M12344".

例4:"a[cd]?"可以匹配 "a","ac","ad".

例5:"a+b"可以匹配 "ab","aab","aaab".

例6:"\^*b"可以匹配 "b","^^^b".

例7:"[ab5@]" 可以匹配 "a" 或 "b" 或 "5" 或 "@".

例8:"[f-k]" 可以匹配 "f"~"k" 之间的任意一个字母.

例9:"[^abc]" 可以匹配 "a","b","c" 之外的任意一个字符.

例10:"[^A-F0-3]" 可以匹配 "A"~"F","0"~"3" 之外的任意一个字符.
posted @ 2024-07-16 11:03  checha  阅读(1)  评论(0编辑  收藏  举报