Zirconi

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

Linux下可直接用regex.h来支持正则表达式。

Android同样也有该头文件,可认为Android也是支持的。

 

#include <sys/types.h>
#include <regex.h>

int regcomp(regex_t *preg, const char *regex, int cflags);

int regexec(const regex_t *preg, const char *string, size_t nmatch, regmatch_t pmatch[], int eflags);

size_t regerror(int errcode, const regex_t *preg, char *errbuf, size_t errbuf_size);

void regfree(regex_t *preg);

 

rm_so为匹配字符串起始偏移(start offset),rm_eo为匹配字符串的终止偏移(end offset)。

typedef struct {
regoff_t rm_so;
regoff_t rm_eo;
} regmatch_t;

 

 1 #include <stdio.h>
 2 #include <regex.h>
 3 #include <string.h>
 4 
 5 int main(void)
 6 {
 7     const char *str = "aabbccdd.com";
 8     const char *pattern = "^(.+)\\.com$";
 9     regex_t reg;
10     regmatch_t match[10];
11 
12     int ret = 0;
13     ret = regcomp(&reg, pattern, REG_EXTENDED | REG_NEWLINE);
14     if(ret != 0)
15         printf("error\n");
16     else
17     {
18         ret = regexec(&reg, str, 10, match, 0);
19         if(ret != REG_NOMATCH)
20         {
21             int len = match[1].rm_eo - match[1].rm_so;
22             char buf[1024] = {0};
23             memcpy(buf, str + match[1].rm_so, len);
24             printf("final buf %s\n", buf);
25         }
26     }
27     regfree(&reg);
28     return 0;
29 }

regmatch_t数组用来存储匹配的结果,该参数为数组的原因实际上是为了匹配group,其规则和Java等实现一致,若匹配成功,数组的[0]为整个匹配串,即group(0),其他为各个匹配到的组。

man regex

posted on 2014-11-03 13:36  Zirconi  阅读(3228)  评论(0编辑  收藏  举报