POSIX正则表达式 验证电子邮件地址

  我们最经常遇到的验证,就是电子邮件地址验证。网站上常见。各种网页脚本也都常用“正则表达式”(regular expression)对我们输入的电子邮件地址进行验证,判断是否合法。有的还能分解出用户名和域名。现在用C语言实现一下电子邮件地址验证程序,用的是POSIX正则表达式。由于用的是POSIX正则表达式,所以只能用gcc编译。

  另外,据测试,只有Linux原版的gcc才能编译通过。如果用Windows中的MinGWCygwingcc编译不通过,错误是找不到<regex.h>头文件。

  C语言源代码如下:

/*
 * regex.c - 用正则表达式验证电子邮件地址
 *
 *          POSIX正则表达式
 *
 *
 * 编译命令:
 *         gcc regex.c -o regex -Wall
 *
 *
 *              Copyright  叶剑飞 2012
 *
 */

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <regex.h>     /* regular expression 正则表达式 */

#define MAX_LENGTH 1000

int main (void)
{
    size_t char_num;
    char email_address[MAX_LENGTH];
    char user_name[MAX_LENGTH];
    char domain_name[MAX_LENGTH];

    regmatch_t pmatch[4];
    regex_t match_regex;

    regcomp( &match_regex,
            "([0-9A-Za-z\\-_\\.]+)@([0-9a-z]+\\.[a-z]{2,3}(\\.[a-z]{2})?)",
            REG_EXTENDED );

    while ( scanf( "%s", email_address ) != EOF )
    {
        if ( regexec( &match_regex, email_address, 4, pmatch, 0 ) == 0 )
        {
            char_num = pmatch[1].rm_eo - pmatch[1].rm_so;
            strncpy( user_name, &(email_address[pmatch[1].rm_so]), char_num );
            user_name[char_num] = '\0';

            char_num = pmatch[2].rm_eo - pmatch[2].rm_so;
            strncpy( domain_name, &(email_address[pmatch[2].rm_so]), char_num );
            domain_name[char_num] = '\0';

            puts( "您输入的电子邮件地址合法" );
            printf ( "用户名:%s\n", user_name );
            printf ( "域名:%s\n\n", domain_name );
        }
        else
            puts( "您输入的电子邮件地址不合法\n\n" );
    }

    regfree( &match_regex );
    return EXIT_SUCCESS;
}
posted @ 2012-10-07 19:06  叶剑飞Victor  阅读(605)  评论(0编辑  收藏  举报