Ajax 中XmlHttp 乱码 的解决方法 (UTF8,GB2312 编码 解码)

 51ajax.comAJAX论坛

用XMLHTTP Post  Form时的表单乱码有两方面的原因——Post表单数据时中文乱码;服务器Response被XMLHTTP不正确编码引起的乱码。换句话说,本文主要解决两个问题——怎样正确Post中文内容&怎样正确显示得到的中文内容。

Part I: Post中文内容

先看看E文的表单是怎么提交的:

CODE:[Copy to clipboard]<SCRIPT language="JavaScript">

strA = "submit1=Submit&text1=scsdfsd";

var oReq = new ActiveXObject("MSXML2.XMLHTTP");

oReq.open("POST","http://ServerName/VDir/TstResult.asp",false);

oReq.setRequestHeader("Content-Length",strA.length); 

oReq.setRequestHeader("CONTENT-TYPE","application/x-www-form-urlencoded");

oReq.send(strA);

</SCRIPT>

如果把strA = "submit1=Submit&text1=scsdfsd";换成:

strA = "submit1=Submit&text1=中文";

你会发现提交上去的东东根本不对,ASP中Request.Form("Text1")根本取不到值。俺用Request.BinaryRead把一个HTML  Form中的Post内容写出来看了看,才发现问题——Form提交时也要编码的,编码后的中文是类于%??%??的转义字符,比如“中文”就被编码为:%D6%D0%CE%C4。呵呵,也怪俺笨,人家CONTENT-TYPE里明明写的清清楚楚——application/x-www-form-urlencoded,urlencoded嘛当然就是这个样子了。既然这样,那我们也知道该怎么办了——自己做转换,代码见下:



CODE:[Copy to clipboard]<SCRIPT language="VBScript">

Function URLEncoding(vstrIn)

strReturn = ""

For i = 1 To Len(vstrIn)

ThisChr = Mid(vStrIn,i,1)

If Abs(Asc(ThisChr)) < &HFF Then

strReturn = strReturn & ThisChr

Else

innerCode = Asc(ThisChr)

If innerCode < 0 Then

innerCode = innerCode + &H10000

End If

Hight8 = (innerCode  And &HFF00)\ &HFF

Low8 = innerCode And &HFF

strReturn = strReturn & "%" & Hex(Hight8) &  "%" &

Hex(Low8)

End If

Next

URLEncoding = strReturn

End Function

strA = URLEncoding("submit1=Submit&text1=中文")

oReq = CreateObject("MSXML2.XMLHTTP")

oReq.open "POST","http://ServerName/VDir/TstResult.asp",false

oReq.setRequestHeader "Content-Length",Len(strA)

oReq.setRequestHeader

"CONTENT-TYPE","application/x-www-form-urlencoded"

oReq.send strA

</ScRIPT>

(在这里俺把前面的JavaScript的代码改成了VBScript,不是吃饱了撑的没事干,原因见后)

Part II.:正确显示得到的中文内容

OK,如果你在Server端把Form的内容写到数据库/文件的话,你在那里看到的中文毫无问题,但是,假如你想看看Server的Response——问题来了:如果Response的结果不是XML,XMLHTTP.responseXML里当然是不会有东东的,那就用responseText好了,在代码的最后加一句:

alert(oReq.responseText)

看看俺们辛勤劳动的结果 

但是但是.....怎么所有的中文全变成了方格?

(我打不出来,有兴趣自己去试,也不用Post,Get一个含有中文的网页就可以发现了。)

原因很简单:XMLHTTP得到Response时假定Response是UTF8编码的,如果Response是XML,那还可以通过encoding来指定编码,但HTML就不行了。(见鬼的GB2312,再次打倒!)所以它把含GB2312编码的HTML当成UTF8格式,不出错才有鬼!

不过好在还有补救的办法:XMLHTTP的responseBody 属性里包含的可是未解码的Resonse——"a raw undecoded bytes as received directly from the server" ,唯一的问题是,responseBody返回的是一个unsigned bytes数组,我们怎么去访问它,怎么把它转换成BSTR?

这就是为什么我在上面把代码改成VBScript的原因——VBScript Can do it,but JavaScript 

代码见下:



CODE:[Copy to clipboard] <SCRIPT language="VBScript">

Function URLEncoding(vstrIn)

strReturn = ""

For i = 1 To Len(vstrIn)

ThisChr = Mid(vStrIn,i,1)

If Abs(Asc(ThisChr)) < &HFF Then

strReturn = strReturn & ThisChr

Else

innerCode = Asc(ThisChr)

If innerCode < 0 Then

innerCode = innerCode + &H10000

End If

Hight8 = (innerCode  And &HFF00)\ &HFF

Low8 = innerCode And &HFF

strReturn = strReturn & "%" & Hex(Hight8) &  "%" &

Hex(Low8)

End If

Next

URLEncoding = strReturn

End Function

Function bytes2BSTR(vIn)

strReturn = ""

For i = 1 To LenB(vIn)

ThisCharCode = AscB(MidB(vIn,i,1))

If ThisCharCode < &H80 Then

strReturn = strReturn & Chr(ThisCharCode)

Else

NextCharCode = AscB(MidB(vIn,i+1,1))

strReturn = strReturn & Chr(CLng(ThisCharCode) *

&H100 + CInt(NextCharCode))

i = i + 1

End If

Next

bytes2BSTR = strReturn

End Function

strA = URLEncoding("submit1=Submit&text1=中文")

oReq = CreateObject("MSXML2.XMLHTTP")

oReq.open "POST","http://ServerName/VDir/TstResult.asp",false

oReq.setRequestHeader "Content-Length",Len(strA)

oReq.setRequestHeader

"CONTENT-TYPE","application/x-www-form-urlencoded"

oReq.send strA

alert bytes2BSTR(oReq.responseBody)

</SSRIPT>

posted @ 2006-08-19 18:22  meil  阅读(5164)  评论(5编辑  收藏  举报