C语言的正则表达式
Beginning
C标准库不支持正则表达式,但大部分Linux发行版本都带有第三方的正则表达式函数库。
以常见的<regex.h>
为例:
/*
regcomp将正则表达式编译成适合后续regexec函数搜索的形式
preg指向模式缓冲区,传出参数
regex字符串,传入参数
cflag决定编译类型,可位或:
-REG_EXTENDED扩展正则表达式语法
-REG_ICASE不区分大小写
-REG_NOSUB不存储匹配结果
-REG_NEWLINE识别换行符
*/
int regcomp(regex_t *preg, const char *regex, int cflags);
/*
regexec使用编译好的模式串匹配字符串,nmatch和pmatch用来提供匹配上的位置信息
其中regmatch_t:
typedef struct {
regoff_t rm_so; //匹配的起始
regoff_t rm_eo; //匹配的结尾
} regmatch_t;
eflags位或,可位或:
-REG_NOTBOL
-REG_NOTEOL
-REG_STARTEND
*/
int regexec(const regex_t *preg, const char *string, size_t nmatch, regmatch_t pmatch[], int eflags);
/*
regerror将regcomp和regexec返回的错误码转为错误信息字符串
errorcode是regcomp和regexec的返回值
errbuf是接收错误信息字符串的缓存区,传出参数
*/
size_t regerror(int errcode, const regex_t *preg, char *errbuf, size_t errbuf_size);
/*清空regex_t结构体内容*/
void regfree(regex_t *preg);
使用的例子:
#include <stdint.h>
#include <stdio.h>
#include <stdlib.h>
#include <regex.h>
#define ARRAY_SIZE(arr) (sizeof((arr)) / sizeof((arr)[0]))
static const char *const str = "1) John Driverhacker;\n2) John Doe;\n3) John Foo;\n";
static const char *const re = "John.*o";
int main()
{
static const char *s = str;
regex_t regex;
regmatch_t pmatch[1];
regoff_t off, len;
if(regcomp(®ex, re, REG_NEWLINE))
exit(EXIT_FAILURE);
printf("String = \"%s\"\n", str);
printf("Matches:\n");
for(int i = 0; ; i++) {
if(regexec(®ex, s, ARRAY_SIZE(pmatch), pmatch, 0))
break;
off = pmatch[0].rm_so + (s - str);
len = pmatch[0].rm_eo - pmatch[0].rm_so;
printf("#%d:\n", i);
printf("offset = %jd; length = %jd\n", (intmax_t) off, (intmax_t) len);
printf("substring = \"%.*s\"\n", len, s + pmatch[0].rm_so);
s += pmatch[0].rm_eo;
}
exit(EXIT_SUCCESS);
}
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?