正则分析js

 int Result(string website)//返回js里面的数字id

     string Html= GetPageCodes("http://www.pcpop.com/");//调用上一篇的抓取页面源代码方法

     string ZipRegexPop = @"\/ashow.*?\.js";//正则匹配js,根据不同情况调整正则表达式,例如:\/.*?\.js,匹配页面全部.js文件

            js = GetPageCode.Getjs(Html, ZipRegexPop);
            len1 = js.LastIndexOf('/');
            len2 = js.LastIndexOf('.');
            len1 = len1 + 1;
            pageid = int.Parse(js.Substring(len1, len2 - len1));
            return pageid;

这样一个简单的方法实现了抓取页面源代码之后,取得想要的show/*/ .js文件,然后进行一些具体的分析

可以根据具体需要取得不同js,因为每个js起的作用不一样,好像是废话吧

以上功能实现是根据任务网址取得源代码里面包含的一个特殊js,可以根据具体需要扩展,在此抛石头引玉了

 

 

posted @ 2010-06-24 13:53  艾伦  阅读(435)  评论(0编辑  收藏  举报