对采集器有很大用处
 

在.NET中通过程序填写和提交表单还是比较简单。比如,要提交一个如下图所示的登录表单:
          

填写和提交以上表单的代码如下:

       // 要提交表单的URI字符串。
       string uriString = "http://www.xxx.com/Login.aspx";
       
// 要提交的字符串数据。
       string postString = "userName=user1&password=password1";
       
// 初始化WebClient
       WebClient webClient = new WebClient();
       webClient.Headers.Add(
"Content-Type""application/x-www-form-urlencoded");
       
// 将字符串转换成字节数组
       byte[] postData = Encoding.ASCII.GetBytes(postString);
       
// 上传数据,返回页面的字节数组
       byte[] responseData = webClient.UploadData(uriString, "POST", postData);
       
// 返回的将字节数组转换成字符串(HTML)
       string srcString = Encoding.UTF8.GetString(responseData);

srcStrinig 就是提交表单后所返回页面的HTML。怎么样,很简单吧。

      但是,以上代码可以提交ASP或JSP生成的表单,却不能提交ASP.NET表单。因为提交ASP.NET表单时,必须给“__VIEWSTATE”和“__EVENTVALIDATION”赋值。“__VIEWSTATE”和“__EVENTVALIDATION”的值可以通过在要提交的页面上按右键“查看源文件”中找到。如下:
        id="__VIEWSTATE" value="/wEPDwUKMTg0NTgwMzM2M2RksjXHwIOzdq/skwDy1k6qTexm2j0="
        id="__EVENTVALIDATION" value="/wEWBAKxhbOEAQKPpuq2CALyveCRDwLejM6fDwP2723lUdzBJVBIAVzbpM2sXYqc" 
通过“查看源文件”得到的“__VIEWSTATE”和“__EVENTVALIDATION”的值还不能直接提交给表单,还需要转换成URL编码的字符串。

       viewState = System.Web.HttpUtility.UrlEncode(viewState);
       eventValidation 
= System.Web.HttpUtility.UrlEncode(eventValidation);

      完整的代码如下:

       // 提交按钮的文本
       string submitButton = "登录";
       
// 页面的 VeiwState(可以通过IE打开页面,右键“查看源文件”取得)
       string viewState = "/wEPDwUKMTg0NTgwMzM2M2RksjXHwIOzdq/skwDy1k6qTexm2j0=";
       
// 页面的 EventValidation(可以通过IE打开页面,右键“查看源文件”取得)
       string eventValidation = "/wEWBAKxhbOEAQKPpuq2CALyveCRDwLejM6fDwP2723lUdzBJVBIAVzbpM2sXYqc";

       submitButton 
= System.Web.HttpUtility.UrlEncode(submitButton);
       viewState 
= System.Web.HttpUtility.UrlEncode(viewState);
       eventValidation 
= System.Web.HttpUtility.UrlEncode(eventValidation);

       
try
       {
           
// 要提交表单的URI字符串。
           string uriString = "http://www.xxx.com/Login.aspx";
           
// 要提交的字符串数据。格式形如:user=uesr1&password=123
           string postString = "userName=1&password=1" + "&loginButton=" + submitButton + "&__VIEWSTATE=" + viewState + "&__EVENTVALIDATION=" + eventValidation;
           
// 初始化WebClient
           WebClient webClient = new WebClient();
           webClient.Headers.Add(
"Content-Type""application/x-www-form-urlencoded");
           
// 将字符串转换成字节数组
           byte[] postData = Encoding.ASCII.GetBytes(postString);
           
// 上传数据,返回页面的字节数组
           byte[] responseData = webClient.UploadData(uriString, "POST", postData);
           
// 将返回的将字节数组转换成字符串(HTML);
           
//     ASP.NET 返回的页面一般是Unicode,如果是简体中文应使用 
           
//     Encoding.GetEncoding("GB2312").GetString(responseData)
           string srcString = Encoding.UTF8.GetString(responseData);
       }
       
catch (WebException we)
       {
           
string msg = we.Message;
       }

       几点说明:
       1)  srcStrinig 是提交表单后所返回页面的HTML,可以使用正则表达式等来分析之,以获得你所需要的数据。
       2)  “__VIEWSTATE”和“__EVENTVALIDATION”的值不是不是一成不变的。
       3)  查看网页POST的数据还可以通过一些工具来查看,比如: 网页数据分析工具HttpWatch,网络嗅探器等。
       4)  如果提交的表单有验证码,则不在本文讨论的范围内。