基本元字符:
. 任意的一个非换行字符
[] 集合匹配,匹配一个[]中出现的字符. 是在多个字符中取一个.
() 调整优先级的作用. 还有一个分组的作用
| 或的意思,测试|一下. 注意,或的优先级最低
限定元字符
+ 紧跟这个符号前面的元素出现1次到多次 {1,}
* 紧跟这个符号前面的元素出现0次到多次 {0,}
? 紧跟这个符号前面的元素有或没有 {0,1}
{n} 紧跟这个符号前面的元素出现n次
{n,} 紧跟这个符号前面的元素出现n次,最多无限次
{n,m} 紧跟这个符号前面的元素出现n次,最多m次
首尾元字符
\d+ "abc123def" "123"
^ 必须以某某字符开头的含义,在[]表示否定 [^abc] 例如:^\d+(必须以数字开头)
$ 必须以某某结尾 例如:\d+$(必须以数字结尾),^\d+$(必须以数字开头和结尾)
$ 分组后对组的引用
简写元字符(小写肯定,大写否定)
\d 数字 \D 非数字 digit
\w 文本 \W 非文本 word
\s 空格 \S 非空格 space
JavaScript、C#
-> C#中
命名空间:System.Text.RegylarExpressions;
Regex
Match
MatchCollection
-> 四个模型
bool Ragex.IsMatch(处理文本, 正则表达式); 文本是否有正则表达式内容
Match Regex.Match(处理文本, 正则表达式); 在文本当中将匹配的内容提取出来(只匹配从左到右第一个)
MatchCollection Regex.Matches(处理文本, 正则表达式); 提取所有匹配文本
string Regex.Replace(处理字符串, 正则表达式, 替换字符串);
1------2-----3---4---5--6---7-----8-----9
Regex.Replace(s, @"\-+", "-")
提取的知识点
-> 提取的两种语法
-> 贪婪模式
-> 分组(如何分、如何用),
[\s\S]表示任意字符
WebClient wc = new WebClient(); string html1 = wc.DownloadString("http://192.168.1.250/"); src="[^"]+" string html = File.ReadAllText("1.txt", Encoding.Default); string regex = @"【\s*\d+\s*】[\s\S]+?</div>"; Match m = Regex.Match(html, regex); Match mm; string s; if (m.Success) { mm = Regex.Match(m.Value, @">[\s\S]+<"); s = mm.Value.Trim('>', '<', '\t', '\r', '\n'); s = Regex.Replace(s, @"\s+", ""); }
List<string> list = new List<string>(); MatchCollection mc = Regex.Matches(html, regex); for (int i = 0; i < mc.Count; i++) { Match m = mc[i]; Match mm; string s; if (m.Success) { mm = Regex.Match(m.Value, @">[\s\S]+<"); s = mm.Value.Trim('>', '<', '\t', '\r', '\n'); s = Regex.Replace(s, @"\s+", ""); list.Add(s); } }
string ip = "http://192.168.1.250/"; WebClient wc = new WebClient(); string html1 = wc.DownloadString("http://192.168.1.250/"); // src="[^"]+" // 分组编号从左往右分别从1开始 MatchCollection mc = Regex.Matches(html1, @"src=""([^""]+jpg)"""); for (int i = 0; i < mc.Count; i++) { Match m = mc[i]; string t = m.Groups[1].Value; // http://www.123.com/123.jpg string address = ip.TrimEnd('/') + "/" + t; wc.DownloadFile(address, i + ".jpg"); }
asp.net 验证正则表达式
整数或者小数:^[0-9]+\.{0,1}[0-9]{0,2}$
只能输入数字:"^[0-9]*$"。
只能输入n位的数字:"^\d{n}$"。
只能输入至少n位的数字:"^\d{n,}$"。
只能输入m~n位的数字:。"^\d{m,n}$"
只能输入零和非零开头的数字:"^(0|[1-9][0-9]*)$"。
只能输入有两位小数的正实数:"^[0-9]+(.[0-9]{2})?$"。
只能输入有1~3位小数的正实数:"^[0-9]+(.[0-9]{1,3})?$"。
只能输入非零的正整数:"^\+?[1-9][0-9]*$"。
只能输入非零的负整数:"^\-[1-9][]0-9"*$。
只能输入长度为3的字符:"^.{3}$"。
只能输入由26个英文字母组成的字符串:"^[A-Za-z]+$"。
只能输入由26个大写英文字母组成的字符串:"^[A-Z]+$"。
只能输入由26个小写英文字母组成的字符串:"^[a-z]+$"。
只能输入由数字和26个英文字母组成的字符串:"^[A-Za-z0-9]+$"。
只能输入由数字、26个英文字母或者下划线组成的字符串:"^\w+$"。
验证用户密码:"^[a-zA-Z]\w{5,17}$"正确格式为:以字母开头,长度在6~18之间,只能包含字符、数字和下划线。
验证是否含有^%&'',;=?$\"等字符:"[^%&'',;=?$\x22]+"。
只能输入汉字:"^[\u4e00-\u9fa5]{0,}$"
验证Email地址:"^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$"。
验证InternetURL:"^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$"。
验证电话号码:"^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$"正确格式为:"XXX-XXXXXXX"、"XXXX- XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX"。
验证身份证号(15位或18位数字):"^\d{15}|\d{18}$"。
验证一年的12个月:"^(0?[1-9]|1[0-2])$"正确格式为:"01"~"09"和"1"~"12"。
验证一个月的31天:"^((0?[1-9])|((1|2)[0-9])|30|31)$"正确格式为;"01"~"09"和"1"~"31"。整数或者小数:^[0-9]+\.{0,1}[0-9]{0,2}$
只能输入数字:"^[0-9]*$"。
只能输入n位的数字:"^\d{n}$"。
只能输入至少n位的数字:"^\d{n,}$"。
只能输入m~n位的数字:。"^\d{m,n}$"
只能输入零和非零开头的数字:"^(0|[1-9][0-9]*)$"。
只能输入有两位小数的正实数:"^[0-9]+(.[0-9]{2})?$"。
只能输入有1~3位小数的正实数:"^[0-9]+(.[0-9]{1,3})?$"。
只能输入非零的正整数:"^\+?[1-9][0-9]*$"。
只能输入非零的负整数:"^\-[1-9][]0-9"*$。
只能输入长度为3的字符:"^.{3}$"。
只能输入由26个英文字母组成的字符串:"^[A-Za-z]+$"。
只能输入由26个大写英文字母组成的字符串:"^[A-Z]+$"。
只能输入由26个小写英文字母组成的字符串:"^[a-z]+$"。
只能输入由数字和26个英文字母组成的字符串:"^[A-Za-z0-9]+$"。
只能输入由数字、26个英文字母或者下划线组成的字符串:"^\w+$"。
验证用户密码:"^[a-zA-Z]\w{5,17}$"正确格式为:以字母开头,长度在6~18之间,只能包含字符、数字和下划线。
验证是否含有^%&'',;=?$\"等字符:"[^%&'',;=?$\x22]+"。
只能输入汉字:"^[\u4e00-\u9fa5]{0,}$"
验证Email地址:"^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$"。
验证InternetURL:"^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$"。
验证电话号码:"^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$"正确格式为:"XXX-XXXXXXX"、"XXXX- XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX"。
验证身份证号(15位或18位数字):"^\d{15}|\d{18}$"。
验证一年的12个月:"^(0?[1-9]|1[0-2])$"正确格式为:"01"~"09"和"1"~"12"。
验证一个月的31天:"^((0?[1-9])|((1|2)[0-9])|30|31)$"正确格式为;"01"~"09"和"1"~"31"。