59.QT-QRegExp和QRegularExpression
1.QRegExp
qt5.0版本之前正则表示示类是QRegExp,通过它能够筛选出我们想要的数据,它的构造函数如下所示:
QRegExp::QRegExp(const QString &pattern, Qt::CaseSensitivity cs = Qt::CaseSensitive, QRegExp::PatternSyntax syntax);
其中QRegExp::PatternSyntax syntax用于解释模式含义的语法,默认选择QRegExp::RegExp,主要参数如下所示:
1.1 QRegExp::RegExp
常见元字符:
- . 匹配除换行符以外的任意字符
- \w 匹配字母或数字或下划线或汉字
- \s 匹配任意的空白符
- \d 匹配数字
- \b 匹配单词的开始或结束
- ^ 匹配字符串的开始
- $ 匹配字符串的结束
- [] 匹配括号内输入的任意字符. 例如[123],只要是1, 2 ,3,12,23都满足
- () 表示一个集合,用于提取匹配的字符串,表达式中有几个()就有几个相应的匹配字符串。
限定重复元字符:
- * 重复零次或更多次 例如, 1*2可以为任意数量个1(甚至没有), 后面跟一个2
- + 重复一次或更多次 例如, 1+2必须为一个或多个1, 后跟一个2
- ? 重复零次或一次 例如,-?1 必须为1,或者-1
- {n} 重复n次 例如 1?2可以为2或12
- {n,} 重复n次或更多次
- {n,m} 重复n到m次
反义元字符:
- \W 匹配任意不是字母,数字,下划线,汉字的字符
- \S 匹配任意不是空白符的字符
- \D 匹配任意非数字的字符
- \B 匹配不是单词开头或结束的位置
- [^x] 匹配除了x以外的任意字符
- [^aeiou] 匹配除了aeiou这几个字母以外的任意字符
元字符转义:
- 如果想查找元字符本身的话,就得使用\来取消这些字符的特殊意义,比如: deerchao\.cn匹配deerchao.cn
元字符使用示例:
^\d{5,12}$ // 匹配数字(比如qq号),必须为5位到12位数字 "^-?\d+$" //匹配整数,可以为负数 "^(-?\d+)(\.\d+)?$" //匹配浮点数 "^\d+$" //匹配非负整数 "^\d+(\.\d+)?$" //匹配非负整数 "^[A-Za-z]+$" //匹配大小写英文字母
1.2 QRegExp::Wildcard
通配符只有?、*、[]三种.
- ? 匹配任意单个字符,和 RegExp的"."相同
- * 匹配任意一个字符序列. 和RegExp的".*"相同
- [] 匹配一个定义的字符集合. 例如, [a-zA-Z\.]可以匹配 a到z之间任意一个字符和. [^a]匹配出小写a以外的字符.
1.3 QRegExp::FixedString
- 这意味着要匹配的模式被解释为普通字符串,即特殊字符(例如反斜杠)不被转义
1.4 使用示例如下所示:
/*只能匹配整数,\\d表示转义字符,C++用\\来表示\ */ QRegExp regx("^-?\\d+$"); QValidator *validator = new QRegExpValidator(regx, this ); ui->lineEdit->setValidator( validator ); //设置lineEdit只能输入数字 QStringList list; list<<"123"; list<<"123A456"; list<<"555a"; list<<"89d"; list<<"3695x"; list<<"69"; list<<"78.9"; foreach(QString s, list.filter(regx)){ //匹配字符串list qDebug()<<s; //过滤数字,只打印123、69 } //检索str时 QString str = "-123"; qDebug()<<str.contains(regx); //返回true QRegExp regx2("-?\\d+"); str = "number : -123xx"; qDebug()<<str.indexOf(regx2); //"-123"的位置在索引9上, QRegExp的缺点就是匹配到起始索引后,无法得到终点索引.
正则表达式讲解链接:https://deerchao.net/tutorials/regex/regex.htm
2.QRegularExpression
QRegularExpression 是Qt 5.0引进的,修复了很多bug,提高了效率,使用时建议使用QRegularExpression。
使用时,只需要构造QRegularExpression类,然后通过match函数来匹配目标字符串即可,match函数如下所示:
QRegularExpressionMatch match(const QString &subject, //被匹配的目标字符串 int offset = 0, //匹配的字符串起始位置 MatchType matchType = NormalMatch, //匹配类型 MatchOptions matchOptions = NoMatchOption) const;// 匹配选项
其中QRegularExpressionMatch类,常用函数如下所示:
- bool hasMatch() : 判断是否匹配
- QString captured(int nth = 0) : 获取匹配到的第nth个集合段.
- int capturedStart(int nth = 0) : 获取匹配到的第nth个集合段的起始索引
- int capturedLength(int nth = 0) :获取匹配到的第nth个集合段的长度
- int capturedEnd(int nth = 0) : 获取匹配到的第nth个集合段的终点索引
示例如下所示:
QRegularExpression re("(\\d+)/(\\d+)/(\\d+)"); QRegularExpressionMatch match = re.match("1999/12/11"); if (match.hasMatch()) { for(int i = 0; !match.captured(i).isEmpty(); i++) { qDebug()<<"index="<<i<<",str="<<match.captured(i)<<",offset:"<<match.capturedStart(i)<<match.capturedEnd(i); } }
打印如下所示:
index= 0 ,str= "1999/12/11" ,offset: 4 14 index= 1 ,str= "1999" ,offset: 4 8 index= 2 ,str= "12" ,offset: 9 11 index= 3 ,str= "11" ,offset: 12 14
因为() 表示一个集合,所以除了匹配(\\d+)/(\\d+)/(\\d+)外,还会再次匹配3个圆括号里的内容,所以就有4个captured
人间有真情,人间有真爱。