用IHttpModule解决输入中文地址乱码问题(一)

测试环境:

服务器 —— [本机] WIindows2003 Enterprise Edition 2003 sp2  中文版本,IIS 6.0,IE 7.0,ASP.NET 2.0
客户端 —— [本机] 同上,Firefox 2.0.0.12

作者:birdshover

本文是初步探讨文章。需要做一下几个假设:
1、网站采用的是ASP.NET部署的;
2、网站的编码是UTF-8的;
3、修改页面链接是成本很小的。

现在面临的主要问题是,页面内有很多链接,参数直接带的就是中文,这样比URL转码后的地址友好。但是,当甲用户把觉得不错的地址发送给好友乙时,问题,出现了,参数将会变成乱码!

事实上在UTF-8环境下,网站上页面的链接是可以为中文的,例如:
<a href="http://localhost/a.aspx?key=就是中文">http://localhost/a.aspx?key=就是中文</a>

但是,复制“http://localhost/a.aspx?key=就是中文”直接敲入地址栏,将会产生乱码。

本文旨在解决地址栏输入中文时出现的问题,这种处理方式简单,但是会与已有链接造成冲突。避免冲突的方法,比较复杂,后续文章将会介绍。

利用.net httpmodule重写,可以解决以上问题。

构造HttpModule如下:
    public class HookModule : IHttpModule
    {

        
#region IHttpModule 成员

        
public void Dispose()
        {
            
        }

        
public void Init(HttpApplication context)
        {
            context.BeginRequest 
+= new EventHandler(context_BeginRequest);
        }

        
void context_BeginRequest(object sender, EventArgs e)
        {
            HttpApplication application 
= (HttpApplication)sender;
            HttpContext context 
= application.Context;
            
string rawurl = context.Request.RawUrl;
            
            context.RewritePath(rawurl);
            
        }



        
#endregion
    }

配置完成后,在地址栏直接输入“http://localhost/a.aspx?key=就是中文”发现已经不产生乱码(IE,TheWorld 2.0)。

但是当在Firefox中敲入以上地址时,发现还是变成了乱码。
那是因为Firefox会强行给地址进行URL编码。把上述代码改造成:

    public class HookModule : IHttpModule
    {

        
#region IHttpModule 成员

        
public void Dispose()
        {
            
        }

        
public void Init(HttpApplication context)
        {
            context.BeginRequest 
+= new EventHandler(context_BeginRequest);
        }

        
void context_BeginRequest(object sender, EventArgs e)
        {
            HttpApplication application 
= (HttpApplication)sender;
            HttpContext context 
= application.Context;
            
string rawurl = context.Request.RawUrl;
            
byte[] bytes = System.Web.HttpUtility.UrlDecodeToBytes(rawurl, Encoding.Default);
            
string s = Encoding.Default.GetString(bytes);
            context.RewritePath(s);
            
        }



        
#endregion
    }

OK,问题解决了,在三种浏览器中都实现了正常显示。

看到这里不要结束,因为问题有可能已经产生了。

你会发现点击<a href="http://localhost/a.aspx?key=就是中文">http://localhost/a.aspx?key=就是中文</a>
这种地址时,反而变成了乱码。

在本文中的解决方法是,把地址编码
System.Web.HttpUtility.UrlEncode("就是中文",Encoding.GetEncoding("gb2312"))
这样就没有乱码的问题了。

注意,上述代码使用Encoding.Default是因为我的系统是中文版本的,因此默认编码就是gb2312.

全文完。
原文出自:http://www.cnblogs.com/birdshover/
posted @ 2008-03-06 00:02  Birdshover  阅读(4733)  评论(6编辑  收藏  举报