C++11标准 STL正则表达式 验证电子邮件地址

  我们最经常遇到的验证,就是电子邮件地址验证。网站上常见。各种网页脚本也都常用“正则表达式”(regular expression)对我们输入的电子邮件地址进行验证,判断是否合法。有的还能分解出用户名和域名。现在用C++语言实现一下电子邮件地址验证程序,用的是C++ 11标准新增加的STL正则表达式。

  源代码如下,该代码已在Visual Studio 2010上验证通过。g++ 4.6不支持C++ 11STL正则表达式,g++ 4.6上编译可以通过,但运行时错误,抛出regex_error异常。因此,如果要在g++ 4.6上使用正则表达式,请用GNU正则表达式库或者用boost正则表达式库。

/*
 * regex.cpp - 用正则表达式验证电子邮件地址
 *
 *  C++11标准  STL正则表达式
 *
 *
 *              Copyright  叶剑飞 2012
 *
 * 编译命令:
 *         cl regex.cpp /EHsc /link /out:regex.exe
 *
 */

#include <iostream>
#include <cstdlib>
#include <string>
#include <regex>  // regular expression 正则表达式

using namespace std;

int main ( )
{
    string email_address;
    string user_name, domain_name;

    regex pattern("([0-9A-Za-z\\-_\\.]+)@([0-9a-z]+\\.[a-z]{2,3}(\\.[a-z]{2})?)");
    // 正则表达式,匹配规则:
    // 第1组(即用户名),匹配规则:0至9、A至Z、a至z、下划线、点、连字符之中
    // 的任意字符,重复一遍或以上
    // 中间,一个“@”符号
    // 第二组(即域名),匹配规则:0至9或a至z之中的任意字符重复一遍或以上,
    // 接着一个点,接着a至z之中的任意字符重复2至3遍(如com或cn等),
    // 第二组内部的一组,一个点,接着a至z之中的任意字符重复2遍(如cn或fr等)
    // 内部一整组重复零次或一次


    // 输入文件结尾符(Windows用Ctrl+Z,UNIX用Ctrl+D)结束循环
    while ( cin >> email_address ) 
    {
        if ( regex_match( email_address, pattern ) )
        {
            cout << "您输入的电子邮件地址合法" << endl;

            // 截取第一组
            user_name = regex_replace( email_address, pattern, string("$1") );

            // 截取第二组
            domain_name = regex_replace( email_address, pattern, string("$2") );

            cout << "用户名:" << user_name << endl;
            cout << "域名:" << domain_name << endl;
            cout << endl;
        }
        else
        {
            cout << "您输入的电子邮件地址不合法" << endl << endl;
        }
    }
    return EXIT_SUCCESS;
}
posted @ 2012-10-07 12:50  叶剑飞Victor  阅读(9157)  评论(1编辑  收藏  举报