运用HttpWebRequest与HttpWebResponse获取Web页数据
2012-08-16 23:23 C#与.NET探索者 阅读(969) 评论(0) 编辑 收藏 举报// Downloads the XML file from the specified server.
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
System.IO.StreamReader sr = new StreamReader(response.GetResponseStream(), System.Text.Encoding.GetEncoding("gb2312"));
Console.Write(sr.ReadToEnd());
sr.Close();
response.Close();
1.获取http地址上的图片
http://www.cnblogs.com/fooo/archive/2007/06/28/798335.html
HttpWebRequest req = (HttpWebRequest)HttpWebRequest.Create("http://www.csdn.net/Images/logo_csdn.gif");
req.Timeout = 150000;
resp = (HttpWebResponse)req.GetResponse();
System.Drawing.Image img;
img = new System.Drawing.Bitmap(resp.GetResponseStream());
2.
HttpWebRequest&HttpWebResponse Headers
介绍
这里简要介绍如何使用HttpWebRequest&HttpWebResponse两个对象与HTTP服务器进行直接交互的过程.HttpWebRequest类对WebRequest中定义的属性和方法提供支持,在使用HttpWebRequest对象向HTTP服务器发起请求时请不要使用HttpWebRequest对象的构造函数,而应该使用WebRequest.Create()方法来初始化新的HttpWebRequest对象.如果统一资源标识符方案是"http://"或"https://"时,Create()则返回HttpWebResponse对象.
代码
首先,我们需要创建一个新的HttpWebRequest对象,代码如下:
HttpWebRequest myrequest = (HttpWebRequest)WebRequest.Create(newUri("urlstring"));
注意:上文中已经提到过不要使用HttpWebRequest的构造函数来创建对象;使用WebRequest.Create()方法初始化HttpWebRequest对象时应该对其进行类型转换.
接下来可以对新初始化的对象进行简单操作,比如可以设置它的标头属性,
下表列出了由属性或方法设置或由系统设置的标头:
标头 |
设置方法 |
Accept | 由Accept属性设置 |
Connection | 由Connection属性和KeepAlive属性设置 |
Content-Length | 由ContentLength属性设置 |
Content-Type | 由ContentType属性设置 |
Expect | 由Expect属性设置 |
Date | 由系统设置为当前日期 |
Host | 由系统设置为当前主机信息 |
If-Modified-Since | 由IfModifiedSince属性设置 |
Range | 由Range属性设置 |
Transfer-Encoding | 由TransferEncoding属性设置 |
Referer | 由Referer属性设置 |
User-Agent |
由UserAgent属性设置 |
注意:HttpWebRequest自动注册.使用以"http://"或"https://"开头的URL之前,不需要调用RegisterPrefix方法来注册
System.Net.HttpWebRequest选自:
MSDN:ms-help://MS.MSDNQTR.v80.chs/MS.MSDN.v80/MS.NETDEVFX.v20.chs/cpref10/html/T_System_Net_HttpWebRequest.htm
在完成对服务器的请求之后,我们需要获取从服务器中返回的信息,正如前面提到过的,使用HttpWebResponse类,具体做法参照如下代码:
HttpWebResponse myresponse = (HttpWebResponse)myrequest.GetResponse();
同样这里我们需要使用HttpWebResponse进行类型转换.到这里,我们已经成功的获得服务器返回的信息,一个myresponse对象,我们可以利用它来获得更多详细的信息,比如从服务器返回的Headers标头,还有其他的有用信息.而在此我们只给您列出如何获得来自服务器响应的Headers 标头信息.我们的具体方法是这样的:
#region GetHeaders
publicstaticWebHeaderCollection GetHeaders(Uri uri)
{
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(uri);
// 省略部分代码......
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
// 省略部分代码......
return response.Headers;
}
#endregion
下面就是提供的main()函数:
// The app entry point
publicstaticvoid Main(string[] args)
{
WebHeaderCollection headers = GetHeaders(newUri("http://www.listim.net"));
string[] headkeys = headers.AllKeys;
Console.WriteLine("{0,-30}{1}", "Name", "Value");
Console.WriteLine("--------------------------------");
foreach (string s in headkeys)
{
Console.WriteLine("{0,-30}{1}", s, headers[s]);
}
}
以下是该程序显示的效果图:
3.
http://blog.csdn.net/Cheaper_c/archive/2004/10/19/142979.aspx
最近在为公司产品(ASP.NET B/S结构)进行升级的时候遇到了客户的这样一个需求.
系统提供会议投票这样一种功能,在会议参与者对此次会议所要研究的合同进行研讨之后,系统把参与者的意见(同意,不同意,有条件同意)和意见的详细信息列出,供会议决策者参考,最后由会议决策者输入决策意见.
其中每一笔合同都包括很多信息,如:法人资料,兄弟公司信息,担保人信息等等,用户迫切需要保存这一系列信息的当前状态.因为这些信息在未来的系统使用过程中可能会发生变更,比如担保人的名称变更等等.
但是所有的这些信息是由不同的功能结合起来组成的,如果想把这些信息进行汇总,那么重写所有的信息获取方法是不太可行的,所以直接请求页面,从服务器返回的HTML数据流中获取所需内容也许是一个可行的办法.
首先在程序中维持一个所有信息请求页面地址的列表,然后循环这个列表,进行信息的获取.
在程序中用到了System.Net, System.IO命名空间.
public string getPageFromURL(string url)
{
string content = "";
// Create a new HttpWebRequest object.Make sure that
// a default proxy is set if you are behind a fure wall.
//其中,HttpWebRequest实例不使用HttpWebRequest的构造函数来创建,二是使用WebRequest的Create方法来创建.
HttpWebRequest myHttpWebRequest1 =(HttpWebRequest)WebRequest.Create(url);
//不维持与服务器的请求状态
myHttpWebRequest1.KeepAlive=false;
//创建一个HttpWebRequest对象
//Assign the response object of HttpWebRequest to a HttpWebResponse variable.\
HttpWebResponse myHttpWebResponse1;
try
{
// 根据微软MSDN上所说:"决不要直接创建HttpWebResponse的实例,要使用HttpWebRequest的GetResponse()方法返回的实例."具体的原因我也不清楚,可能HttpWebResponse类的构造函数中没有实现HttpWebResponse实例的代码吧.
myHttpWebResponse1 = (HttpWebResponse)myHttpWebRequest1.GetResponse();
//设置页面的编码模式
System.Text.Encoding utf8 = System.Text.Encoding.Default;
Stream streamResponse=myHttpWebResponse1.GetResponseStream();
StreamReader streamRead = new StreamReader(streamResponse, utf8);
Char[] readBuff = new Char[256];
//这里使用了StreamReader的Read()方法,参数意指从0开始读取256个char到readByff中.
//Read()方法返回值为指定的字符串数组,当达到文件或流的末尾使,方法返回0
int count = streamRead.Read( readBuff, 0, 256 );
while (count > 0)
{
String outputData = new String(readBuff, 0, count);
content += outputData;
count = streamRead.Read(readBuff, 0, 256);
}
myHttpWebResponse1.Close();
return(content);
}
catch(WebException ex)
{
content = "在请求URL为:" + url + "的页面时产生错误,错误信息为" + ex.ToString();
return(content);
}
}
2.使用HttpWebRequest、HttpWebResponse获取网页中文乱码解决方案
我想在程序里面读取一个网页,然后把网页的内容显示出来,开始的时候使用代码如下:
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(addr);
// Downloads the Xml file from the specified server.
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
System.IO.StreamReader sr = new StreamReader(response.GetResponseStream());
Console.Write(sr.ReadToEnd());
sr.Close();
response.Close();
的一次测试时返回了数据,测试的使用的是一个e文网站。OK,一切顺利,但是换了一个中文
网站问题就出来了,中文居然显示是乱码,晕倒,搞了好长时间也没有搞定。后来研究了StreamReader
类的构造函数,发现有个构造函数是可以指定字符编码格式。好,查文档,HttpWebResponse 中有个
CharacterSet属性是服务器端文件编码格式,把这个设置进去,代码如下:
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(addr);
// Downloads the Xml file from the specified server.
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
System.IO.StreamReader sr = new StreamReader(response.GetResponseStream(), response.CharacterSet);
Console.Write(sr.ReadToEnd());
sr.Close();
response.Close();
嗯,这回不错,用 http://www.qq39.Net 测试一下,居然中文返回的不会乱码了,再用其它的中文网站测试一把。
我哭,http://www.maitian.cn/mt_fz_center/member/index.asp 这个网址返回的中文居然还是乱码。为什么同样
是中文网站,返回的数据会不同呢?应该还是CharacterSet属性的问题。跟踪代码,发现能够正确显示中文的网站
返回的 CharacterSet 属性值是 gb2312,不能正确显示中文的一般是 ISO-8859-1。好,那我就把编码格式都指定
成 gb2312.代码如下:
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(addr);
// Downloads the Xml file from the specified server.
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
System.IO.StreamReader sr = new StreamReader(response.GetResponseStream(), System.Text.Encoding.GetEncoding("gb2312"));
Console.Write(sr.ReadToEnd());
sr.Close();
response.Close();
O, YEAH!这次万事顺利,返回的都是中文,折磨我一天一夜的问题终于解决,心里那个爽呀,嘿嘿。具体的代码如下:
using System;
using System.Xml;
using System.Net;
using System.IO;
public class CSharpHttpExample
{
public static void Main()
{
// Change the Microsoft Inte.Net Information Server (IIS) name in following URL.
while (true)
{
Console.WriteLine("please input url:");
string addr = Console.ReadLine();
while (addr.Length == 0)
{
Console.WriteLine("please input url:");
addr = Console.ReadLine();
}
try
{
HttpWebRequest request = (HttpWebRequest)WebRequest.Create(addr); //http://www.qq39.Net http://www.maitian.cn/mt_fz_center/member/index.asp
// Change Username and password.
//request.Credentials = new.NetworkCredential("[username]", "[password]");
// Downloads the Xml file from the specified server.
HttpWebResponse response = (HttpWebResponse)request.GetResponse();
Console.WriteLine(response.CharacterSet);
Console.WriteLine("please input charset:");
addr = Console.ReadLine();
//System.IO.BufferedStream bf = new BufferedStream(response.GetResponseStream);
System.IO.StreamReader sr = new StreamReader(response.GetResponseStream(), System.Text.Encoding.GetEncoding(addr));
Console.Write(sr.ReadToEnd());
sr.Close();
response.Close();
}
catch(Exception ex)
{
Console.WriteLine(ex.Message);
}
// Releases the resources of the response.
Console.Read();
}
}
}
3.
如何使用 HttpWebRequest 类和 HttpWebResponse 类来通过 VisualC # 运行 Exchange 2000 服务器计算机上创建约会项目
要在 Visual C#, 是运行 Exchange 2000 计算机上创建约会项目请按照下列步骤:1. 启动 MicrosoftVisualStudio.Net 或 Microsoft Visual Studio 2005。
2. 在 文件 菜单, 指向 新建 , 然后单击 项目 。
3. 在 VisualC # 项目类型 列表, 单击 控制台应用程序 。
注意 对于 Visual Studio 2005, 单击 VisualC # 列表中 控制台应用程序 。
VisualStudio.Net 中, 默认情况下创建 Class 1。 在 Visual Studio 2005, Program.cs 创建默认。
4. 在代码窗口, 替换为以下代码:
using System;
using System.Net;
using System.IO;
namespace WebDa.Net
{
/// <summary>
/// Summary description for Class1.
/// </summary>
class Class1
{
static void Main(string[] args)
{
try
{
// TODO: Replace with the URL of an object on Exchange Server
string sUri = http://ExchServer/Exchange/Administrator/Calendar/testappt.eml;
System.Uri myUri = new System.Uri(sUri);
HttpWebRequest HttpWRequest = (HttpWebRequest)WebRequest.Create(myUri);
string strXmlNSInfo = "Xmlns:g="DAV:" " + " Xmlns:e="http://schemas.microsoft.com/exchange/"" + " Xmlns:mapi="http://schemas.microsoft.com/mapi/"" + " Xmlns:x="Xml:" Xmlns:cal="urn:schemas:calendar:"" + " Xmlns:dt="urn:uuid:c2f41010-65b3-11d1-a29f-00aa00c14882/"" + " Xmlns:mail="urn:schemas:httpmail:">";
string sQuery = "<?Xml version="1.0"?>" + "<g:propertyupdate " + strXmlNSInfo + "<g:set>" + "<g:prop>" + "<g:contentclass>urn:content-classes:appointment</g:contentclass>" + "<e:outlookmessageclass>IPM.Appointment</e:outlookmessageclass>" + "<mail:subject>Appointment Subject</mail:subject>" + "<cal:location>Appointment Location</cal:location>" + "<cal:dtstart dt:dt="dateTime.tz">2001-12-27T22:00:00.000Z</cal:dtstart>" + "<cal:dtend dt:dt="dateTime.tz">2001-12-27T22:30:00.000Z</cal:dtend>" + "<cal:instancetype dt:dt="int">0</cal:instancetype>" + "<cal:busystatus>BUSY</cal:busystatus>" + "<cal:meetingstatus>TENTATIVE</cal:meetingstatus>" + "<cal:alldayevent dt:dt="boolean">0</cal:alldayevent>" + "</g:prop>" + "</g:set>" + "</g:propertyupdate>";
// Set credentials.
// TODO: Replace with appropriate user credential
.NetworkCredential myCred = new.NetworkCredential(@"DomainNameUserName", "UserPassword");
CredentialCache myCredentialCache = new CredentialCache();
myCredentialCache.Add(myUri, "Basic", myCred);
HttpWRequest.Credentials = myCredentialCache;
// Set headers.
HttpWRequest.KeepAlive = false;
HttpWRequest.Headers.Set("Pragma", "no-cache");
HttpWRequest.Headers.Set("Translate", "f");
HttpWRequest.ContentType = "text/Xml";
HttpWRequest.ContentLength = sQuery.Length;
//Set the request timeout to 5 minutes. HttpWRequest.Timeout = 300000;
// set the request method
HttpWRequest.Method = "PROPPATCH";
// Store the data in a byte array. byte[] ByteQuery = System.Text.Encoding.ASCII.GetBytes(sQuery);
HttpWRequest.ContentLength = ByteQuery.Length;
Stream QueryStream = HttpWRequest.GetRequestStream();
// Write the data to be posted to the request stream.
QueryStream.Write(ByteQuery,0,ByteQuery.Length);
QueryStream.Close();
// Send the request and get the response. HttpWebResponse HttpWResponse = (HttpWebResponse)HttpWRequest.GetResponse();
// Get the Status code.
int iStatCode = (int)HttpWResponse.StatusCode;
string sStatus = iStatCode.ToString();
Console.WriteLine("Status Code: {0}", sStatus);
// Get the request headers
string sReqHeaders = HttpWRequest.Headers.ToString();
Console.WriteLine(sReqHeaders);
// Read the response stream.
Stream strm = HttpWResponse.GetResponseStream();
StreamReader sr = new StreamReader(strm);
string sText = sr.ReadToEnd();
Console.WriteLine("Response: {0}", sText);
// Close the stream.
strm.Close();
// Clean up
myCred = null;
myCredentialCache = null;
HttpWRequest = null;
HttpWResponse = null;
QueryStream = null;
strm = null;
sr = null;
}
catch (Exception e)
{
Console.WriteLine("{0} Exception caught.", e);
}
}
}
}
5. 代码, 中搜索 TODO 和然后修改用于环境代码。
6. 按 F 5 键生成并以运行该程序。
7. 请确保已创建约会项目
- HttpWebRequest
HttpWebRequest 类对 WebRequest 中定义的属性和方法提供支持,也对使用户能够直接与使用 HTTP 的服务器交互的附加属性和方法提供支持。
使用 System.Net.WebRequest.Create 方法初始化新的 HttpWebRequest 对象。如果统一资源标识符 (URI) 的方案是http://
或https://
,则 Create 返回 HttpWebRequest 对象。
GetResponse 方法向 RequestUri 属性中指定的资源发出同步请求并返回包含该响应的 HttpWebResponse。可以使用 BeginGetResponse 和 EndGetResponse 方法对资源发出异步请求。
当要向资源发送数据时,GetRequestStream 方法返回用于发送数据的 Stream 对象。BeginGetRequestStream 和 EndGetRequestStream 方法提供对发送数据流的异步访问。
对于使用 HttpWebRequest 的客户端验证身份,客户端证书必须安装在当前用户的“我的证书”存储区中。
如果在访问资源时发生错误,则 HttpWebRequest 类将引发 WebException。WebException.Status 属性包含指示错误源的 WebExceptionStatus 值。当 WebException.Status 为 WebExceptionStatus.ProtocolError 时,Response 属性包含从资源接收的 HttpWebResponse。
HttpWebRequest 将发送到 Internet 资源的公共 HTTP 标头值公开为属性,由方法或系统设置;下表包含完整列表。可以将 Headers 属性中的其他标头设置为名称/值对。注意,服务器和缓存在请求期间可能会更改或添加标头。
- HttpWebResponse
此类包含对 WebResponse 类中的属性和方法的 HTTP 特定用法的支持。HttpWebResponse 类用于生成发送 HTTP 请求和接收 HTTP 响应的 HTTP 独立客户端应用程序。
决不要直接创建 HttpWebResponse 类的实例。而应当使用通过调用 HttpWebRequest.GetResponse 所返回的实例。您必须调用 Stream.Close 方法或 HttpWebResponse.Close 方法来关闭响应并将连接释放出来供重用。不必同时调用 Stream.Close 和 HttpWebResponse.Close,但这样做不会导致错误。
从 Internet 资源返回的公共标头信息公开为该类的属性。有关完整的列表,请参见下表。可以从 Headers 属性以名称/值对的形式读取其他标头。
关键代码:
Imports System.IO
Imports System.Text.RegularExpressions
Partial Class Default4
Inherits System.Web.UI.Page
'获取Web页上的数据
Protected Sub btn_GetResponse_Click(ByVal sender As Object, ByVal e As System.EventArgs) Handles btn_GetResponse.Click
Dim strURL As String = String.Empty
Dim strResult As String = String.Empty
Dim hwr As HttpWebRequest = Nothing
Dim hws As HttpWebResponse = Nothing
If Me.CheckURL(Me.txtURL.Text, strURL) Then
hwr = HttpWebRequest.Create(strURL)
hwr.Method = "Get"
hws = hwr.GetResponse
'为避免乱码,对数据流进行了gb2312编码
Using sr As StreamReader = New StreamReader(hws.GetResponseStream, Encoding.GetEncoding("gb2312"))
Me.txtResult.Text = sr.ReadToEnd.Trim
End Using
Else
Me.Label_CheckedResult.Text = "无效的URL"
End If
End Sub
'该例程主要是用来匹配输入的URL是否符合标准
Private Function CheckURL(ByVal url As String, ByRef URLReturnValue As String) As Boolean
If Regex.IsMatch(url.Trim, "http(s)?://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?") Then
URLReturnValue = url.Trim
Return True
Else
URLReturnValue = String.Empty
Return False
End If
End Function
'该例程主要检查输入的URL指向的站点是否可用
Protected Sub btn_CheckURLActive_Click(ByVal sender As Object, ByVal e As System.EventArgs) Handles btn_CheckURLActive.Click
Dim strURL As String = String.Empty
Dim strResult As String = String.Empty
Dim hwr As HttpWebRequest = Nothing
Dim hws As HttpWebResponse = Nothing
If Me.CheckURL(Me.txtURL.Text, strURL) Then
Try
hwr = HttpWebRequest.Create(strURL)
hwr.Method = "HEAD"
hwr.Timeout = 100
hws = hwr.GetResponse
If hws.StatusCode = HttpStatusCode.OK Then
Me.Label_CheckedResult.Text = "您输入的URL可以用"
Me.btn_GetResponse.Enabled = True
Else
Me.Label_CheckedResult.Text = "您输入的URL不可用"
Me.btn_GetResponse.Enabled = False
End If
Catch ex As Exception
Me.Label_CheckedResult.Text = "发生错误,信息如下:" & ex.Message
End Try
Else
Me.Label_CheckedResult.Text = "无效的URL"
End If
End Sub
End Class