QRegExp类正则表达式

一、QRegExp简介

QRegExp类是QT中的正则表达式，由表达式、量词和断言组成。

主要有四个作用：有效性检查、查找、替换、字符串分割，具体如下。

（1）有效性检查，检查字符串是否满足一定要求。

（2）查找，提供了比QString类更强大的匹配模型。

（3）替换，对字符串内符合或不符合要求的字符串进行替换。

（4）字符串分割，将字符串所需的部分，使用正则表达式进行分割

二、元字符及通配模式

1.元字符

元字符是QRegExp中的一类正则表达式，它表示一个或多个常量表达式

元字符	作用	实例
.	匹配任意单个字符	1.2，可能是1后面跟任意字符，再跟2
^	匹配字符串首	^12，可以是123，但不能是312
$	匹配字符串尾	12$，可以是312, 当不能是 123
[]	匹配括号内输入的任意字符	[123]，可以为1、 2 或3
*	匹配任意数量的前导字符	1*2，可以为任意数量个1(甚至没有)，后面跟一个2
+	匹配至少一个前导字符	1+2，必须为一个或多个1, 后跟一个2
?	匹配一个前导字符或为空	1?2，可以为2或者12

2.通配模式

QRegExp类支持通配符匹配，通配模式相比于RegExp更为简单
在通配模式下，只有?、、[]3个字符可以使用，它们的功能发生变化
通过QRegExp::setPatternSyntax(QRegExp::Wildcard)可以将元字符设置为通配模式
通配符作用实例
?匹配任意单个字符 1?2，可以为1,后面跟任意单个字符，再跟2
*匹配任意一个字符序列 12，可以为1, 后面跟任意数量的字符，再跟一个2
[]匹配一个定义的字符集合 [a-z]可以匹配 a到z之间任意一个字符； [^a]匹配除小写a以外的字符.

三、QRegExp构造和方法

1.默认构造函数

产生一个空的正则表达式对象，函数声明如下。
QRegExp();

2.模式构造函数

产生指定匹配模式的正则表达式对象，函数声明如下。
QRegExp(const QString &pattern, Qt::CaseSensitivity cs = Qt::CaseSensitive,PatternSyntax syntax = RegExp)

3. isValid() 函数

判断正则表达式是否合法，合法返回true，否则返回false。

QRegExp exp1("[a-z]");
bool valid=exp1.isValid();	//返回true
QRegExp exp1("[a-z");
bool valid=exp1.isValid();	//返回false

4. caseSensitivity() 函数

判断正则表达式是否大小写敏感。
Qt::CaseSensitivity caseSensitivity() const;

5. cap() 和capturedTexts() 函数

前者获得捕捉的每一项，index从1开始，后者则获得整个捕捉列表。

QString pattern() const;
QStringList capturedTexts() const;

6. indexIn() 函数

进行匹配，如果成功则返回index，不成功返回-1。
indexIn(const QString &str, int offset = 0, CaretMode caretMode = CaretAtZero) const;

7. exactMatch() 函数，

是否整串匹配，返回true或false。
exactMatch(const QString &str) const;

8. matchedLength() 函数

返回匹配的串的长度。
int matchedLength() const;

9. pattern() 函数

获得正则表达式本身。
QString pattern() const;

10.构造和方法实例

QRegExp类部分方法使用实例如下：

QRegExp expression;									//定义QRegExp 
expression.setPatternSyntax(QRegExp::RegExp);		//设置为RegExp模式
expression.setCaseSensitivity(Qt::CaseSensitive); 	//设置大小写敏感
expression.setPattern(QString("^[A-Za-z0-9]+$")); 	//匹配所有大小写字母和数字组成的字符串
QString s = "kojad@0123";							//定义字符串
expression.exactMatch(s); 							//返回的值为false，因为s中含有@字符

四、常用正则表达式实例

以下列出了一些正则表达式含义、常用写法，以及具体实例。

1.常用正则表达式及实例1

\r, \n 代表 回车和换行符

\t 制表符

\\ 代表 "\" 本身

\^ 匹配 ^ 符号本身

\$ 匹配 $ 符号本身

. 匹配除了换行符以外的任意字符

\w 匹配字母、数字、下划线、汉字

\s 匹配任意的空白符

\b 单词的开始或结尾  

\~ 匹配字符串的开始  

$ 匹配字符串的结束

[]  包含一系列字符

[^]  包含之外一系列字符

例1："\ba\w*\b" ，匹配以字母a开头的单词,先是开始(\b)，然后是字母a,然后是任意数量的字母或数字(\w*)，最后是结束(\b).

例2："\d+"，匹配1个或更多连续的数字。+匹配重复1次或更多次.

例3："\b\w{6}\b"， 匹配刚好6个字符的单词.

例4："[ab5@]": 匹配 "a" 或 "b" 或 "5" 或 "@".

例5："[^abc]"： 包含abc之外的任意字符.

例6："[f-k]": f-k之间的任意字符.

2.常用正则表达式及实例2

{n} 表达式重复n次，比如："\w{2}" 相当于 "\w\w"；"a{5}" 相当于 "aaaaa".

{m,n} 表达式至少重复m次，最多重复n次，比如："ba{1,3}"可以匹配 "ba"或"baa"或"baaa".

{m,} 表达式至少重复m次，比如："\w\d{2,}"可以匹配 "a12","_456","M12344".

? 表达式0次或者1次，相当于 {0,1}，比如："a[cd]?"可以匹配 "a","ac","ad"

+ 表达式至少出现1次，相当于 {1,}，比如："a+b"可以匹配 "ab","aab","aaab".  

* 表达式不出现或出现任意次，相当于 {0,}，比如："\^*b"可以匹配 "b","^^^b".

例1："\w{2}"相当于 "\w\w"；"a{5}" 相当于 "aaaaa".

例2："ba{1,3}"可以匹配 "ba"或"baa"或"baaa".

例3："\w\d{2,}"可以匹配 "a12","_456","M12344".

例4："a[cd]?"可以匹配 "a","ac","ad".

例5："a+b"可以匹配 "ab","aab","aaab".

例6："\^*b"可以匹配 "b","^^^b".

例7："[ab5@]" 可以匹配 "a" 或 "b" 或 "5" 或 "@".

例8："[f-k]" 可以匹配 "f"~"k" 之间的任意一个字母.

例9："[^abc]" 可以匹配 "a","b","c" 之外的任意一个字符.

例10："[^A-F0-3]" 可以匹配 "A"~"F","0"~"3" 之外的任意一个字符.

posted @ 2024-07-16 11:03 checha 阅读(726) 评论(0) 收藏举报

刷新页面返回顶部

checha