正则分析js
int Result(string website)//返回js里面的数字id
{
string Html= GetPageCodes("http://www.pcpop.com/");//调用上一篇的抓取页面源代码方法
string ZipRegexPop = @"\/ashow.*?\.js";//正则匹配js,根据不同情况调整正则表达式,例如:\/.*?\.js,匹配页面全部.js文件
js = GetPageCode.Getjs(Html, ZipRegexPop);
len1 = js.LastIndexOf('/');
len2 = js.LastIndexOf('.');
len1 = len1 + 1;
pageid = int.Parse(js.Substring(len1, len2 - len1));
return pageid;
}
这样一个简单的方法实现了抓取页面源代码之后,取得想要的show/*/ .js文件,然后进行一些具体的分析
可以根据具体需要取得不同js,因为每个js起的作用不一样,好像是废话吧
以上功能实现是根据任务网址取得源代码里面包含的一个特殊js,可以根据具体需要扩展,在此抛石头引玉了