赞助

C++11标准 STL正则表达式 验证电子邮件地址

转自:http://www.cnblogs.com/yejianfei/archive/2012/10/07/2713715.html

我们最经常遇到的验证,就是电子邮件地址验证。网站上常见。各种网页脚本也都常用“正则表达式”(regular expression)对我们输入的电子邮件地址进行验证,判断是否合法。有的还能分解出用户名和域名。现在用C++语言实现一下电子邮件地址验证程序,用的是C++ 11标准新增加的STL正则表达式。

  源代码如下,该代码已在Visual Studio 2010上验证通过。g++ 4.6不支持C++ 11的STL正则表达式,g++ 4.6上编译可以通过,但运行时错误,抛出regex_error异常。因此,如果要在g++ 4.6上使用正则表达式,请用GNU正则表达式库或者用boost正则表达式库。

 

 1 /*
 2  * regex.cpp - 用正则表达式验证电子邮件地址
 3  *
 4  *  C++11标准  STL正则表达式
 5  *
 6  *
 7  *         
 8  *
 9  * 编译命令:
10  *         cl regex.cpp /EHsc /link /out:regex.exe
11  *
12  */
13 
14 #include <iostream>
15 #include <cstdlib>
16 #include <string>
17 #include <regex>  // regular expression 正则表达式
18 
19 using namespace std;
20 
21 int main ( )
22 {
23     string email_address;
24     string user_name, domain_name;
25 
26     //regex pattern("([0-9A-Za-z\\-_\\.]+)@([0-9a-z]+\\.[a-z]{2,3}(\\.[a-z]{2})?)"); //这个不全
  regex pattern("([0-9A-Za-z\\-_\\.]+)@(([a-zA-Z0-9\\-])+\\.+[a-z]{2,3}(\\.[a-z]{2})?)"); //这个最全
27 // 正则表达式,匹配规则: 28 // 第1组(即用户名),匹配规则:0至9、A至Z、a至z、下划线、点、连字符之中 29 // 的任意字符,重复一遍或以上 30 // 中间,一个“@”符号 31 // 第二组(即域名),匹配规则:0至9或a至z之中的任意字符重复一遍或以上, 32 // 接着一个点,接着a至z之中的任意字符重复2至3遍(如com或cn等), 33 // 第二组内部的一组,一个点,接着a至z之中的任意字符重复2遍(如cn或fr等) 34 // 内部一整组重复零次或一次 35 36 37 // 输入文件结尾符(Windows用Ctrl+Z,UNIX用Ctrl+D)结束循环 38 while ( cin >> email_address ) 39 { 40 if ( regex_match( email_address, pattern ) ) 41 { 42 cout << "您输入的电子邮件地址合法" << endl; 43 44 // 截取第一组 45 user_name = regex_replace( email_address, pattern, string("$1") ); 46 47 // 截取第二组 48 domain_name = regex_replace( email_address, pattern, string("$2") ); 49 50 cout << "用户名:" << user_name << endl; 51 cout << "域名:" << domain_name << endl; 52 cout << endl; 53 } 54 else 55 { 56 cout << "您输入的电子邮件地址不合法" << endl << endl; 57 } 58 } 59 return EXIT_SUCCESS; 60 }

 

 2014-11-11补充 :

 1 string GetUrlDomainName(string url)
 2 {
 3     string user_name, domain_name,temp,com,cn;
 4     const std::regex pattern("([0-9A-Za-z\\-_\\.]+)@(([a-zA-Z0-9\\-])+\\.+[a-z]{2,3}(\\.[a-z]{2})?)");
 5 
 6     if ( std::regex_match(url.c_str(), pattern ))
 7     {
 8         // 截取第一组
 9         user_name = regex_replace(url.c_str(), pattern, string("$1") );
10 
11         // 截取第二组
12         domain_name = regex_replace(url.c_str(), pattern, string("$2") );
13 
14         const std::regex subPattern("([a-zA-Z0-9\\-_]+)\\.([a-z]{2,3}(\\.[a-z]{2})?)");//这个正则对于.com和.com.cn都适合
15         //const std::regex subPattern("([a-zA-Z0-9\\-_]+)\\.([a-z]{2,3})\\.(([a-z]{2})?)");//这个正则只适合后面.com.cn
16         if (std::regex_match(domain_name,subPattern))
17         {
18             temp = regex_replace(domain_name,subPattern,string("$1"));//@和com之间 
19             com = regex_replace(domain_name,subPattern,string("$2"));//得到com
20             cn = regex_replace(domain_name,subPattern,string("$3"));//得到cn
21         }
22     }
23     return temp;
24 }

 

 

posted @ 2014-08-11 17:46  车臣  阅读(1226)  评论(0编辑  收藏  举报