C语言的正则表达式

阅读(69)
评论(0)
Beginning

C标准库不支持正则表达式,但大部分Linux发行版本都带有第三方的正则表达式函数库。
以常见的<regex.h>为例:

/*
regcomp将正则表达式编译成适合后续regexec函数搜索的形式
preg指向模式缓冲区,传出参数
regex字符串,传入参数
cflag决定编译类型,可位或:
  -REG_EXTENDED扩展正则表达式语法
  -REG_ICASE不区分大小写
  -REG_NOSUB不存储匹配结果
  -REG_NEWLINE识别换行符
*/
int regcomp(regex_t *preg, const char *regex, int cflags);
/*
regexec使用编译好的模式串匹配字符串,nmatch和pmatch用来提供匹配上的位置信息
其中regmatch_t:
typedef struct {
  regoff_t rm_so;  //匹配的起始
  regoff_t rm_eo;  //匹配的结尾
} regmatch_t;
eflags位或,可位或:
  -REG_NOTBOL
  -REG_NOTEOL
  -REG_STARTEND
*/
int regexec(const regex_t *preg, const char *string, size_t nmatch, regmatch_t pmatch[], int eflags);
/*
regerror将regcomp和regexec返回的错误码转为错误信息字符串
errorcode是regcomp和regexec的返回值
errbuf是接收错误信息字符串的缓存区,传出参数
*/
size_t regerror(int errcode, const regex_t *preg, char *errbuf, size_t errbuf_size);
/*清空regex_t结构体内容*/
void regfree(regex_t *preg);

使用的例子:

#include <stdint.h>
#include <stdio.h>
#include <stdlib.h>
#include <regex.h>
#define ARRAY_SIZE(arr) (sizeof((arr)) / sizeof((arr)[0]))
static const char *const str = "1) John Driverhacker;\n2) John Doe;\n3) John Foo;\n";
static const char *const re = "John.*o";
int main()
{
  static const char *s = str;
  regex_t regex;
  regmatch_t pmatch[1];
  regoff_t off, len;
  if(regcomp(&regex, re, REG_NEWLINE))
    exit(EXIT_FAILURE);
  printf("String = \"%s\"\n", str);
  printf("Matches:\n");
  for(int i = 0; ; i++) {
    if(regexec(&regex, s, ARRAY_SIZE(pmatch), pmatch, 0))
      break;
    off = pmatch[0].rm_so + (s - str);
    len = pmatch[0].rm_eo - pmatch[0].rm_so;
    printf("#%d:\n", i);
    printf("offset = %jd; length = %jd\n", (intmax_t) off, (intmax_t) len);
    printf("substring = \"%.*s\"\n", len, s + pmatch[0].rm_so);
    s += pmatch[0].rm_eo;
  }
  exit(EXIT_SUCCESS);
}
posted @   songlh424  阅读(69)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?
more_horiz
keyboard_arrow_up light_mode palette
选择主题
点击右上角即可分享
微信分享提示