一步一步教你抓数据——用.net精确提取网站数据的通用方法
正则工具帮助
C#正则表达式整理备忘
在[]中[^.\所有元字符都表示原来的意思.就匹配.(点)
.*([0-9]+)
jaa 2003 ()匹配3(.*匹配前面所有的先来先服务)
<[^>]+> [^>]+匹配不是>的字符
(?=exp) 匹配str后面跟的是exp的位置
(?!exp) 匹配str后面跟的不是exp的位置
string x = "1024 used 2048 free";
Regex r1 = new Regex(@"\d{4}(?= used)");
if (r1.Matches(x).Count==1)
{
Console.WriteLine("r1 match:" + r1.Match(x).Value);//输出:1024
}
Regex r2 = new Regex(@"\d{4}(?! used)");
if (r2.Matches(x).Count==1)
{
Console.WriteLine("r2 match:" + r2.Match(x).Value); //输出:2048
}
//r1中的正声明表示必须保证在四位数字的后面必须紧跟着'used',r2中的负声明表示四位数字之后不能跟有'used'。
(?<=exp) 匹配str前面跟的是exp的位置
(?<!exp) 匹配str前面跟的不是exp的位置
string x = "used:1024 free:2048";
Regex r1 = new Regex(@"(?<=used:)\d{4}");
if (r1.Matches(x).Count==1)
{
Console.WriteLine("r1 match:" + r1.Match(x).Value);//输出:1024
}
Regex r2 = new Regex(@"(?<!used:)\d{4}");
if (r2.Matches(x).Count==1)
{
Console.WriteLine("r2 match:" + r2.Match(x).Value);//输出:2048
}
//r1中的反向正声明表示在4位数字之前必须紧跟着“used:”,r2中的反向负声明表示在4位数字之前必须紧跟着除“used:”之外的字符串。