摘要:
先看下面两个Url,他们传递的参数一样么?aaa.aspx?tag=.net%bc%bc%ca%f5aaa.aspx?tag=.net%e6%8a%80%e6%9c%af看起来好像是不一样,其实他们都是对".net技术"进行了UrlEncode,不过一个是GB2312的编码,一个是Utf-8的编码。Response.Write(Request.QueryString["tag"]); 可以得到Utf-8传过来的正确参数,而GB2312是错误的可以用下面的得到GB2312的URLstring q = Request.Url.Query;System.Col 阅读全文
摘要:
这里所说的搜索引擎主要是Google,因为像百度这种搜索引擎,老老实实的只使用GB2312编码,自然不存在识别的问题。而Google本来也很厚道的会在Url中标识一下关键词的编码类型,可惜得加一个修饰“有时”,而另外一些时候,它会十分体贴的自动识别转化而不告诉你……本着“Google可往,我亦可往”的信念,自己动手解决关键字编码自动识别的问题。好在需要识别的范围已经限定了:GB2312 or UTF-8。那么当然要从了解这两种编码的编码格式下手。网上资源很多,摘其精华。两种编码的格式限定:GB2312:每个汉字及符号以两个字节来表示。第一个字节称为“高位字节”,第二个字节称为“低位字节”。 “ 阅读全文