MMS subject 编码中的Charset为何是0xEA

Posted on 2008-04-11 17:19  Jerry Ren  阅读(522)  评论(0编辑  收藏  举报

在调试MMS的一个bug的时候,对MMS 的subject域中为何根据0xEA来判断是否是utf8不理解,于是google,然后发现好多都来自一个版本, 写的煞有介事:


0xEA展开二进制即是1101010,表示后面的字符串编码是以110 10 10分隔的UTF8的字符串。
当时就纳闷,UTF8的规范不就是110 10 10或者1110 10 10 10这样的吗?怎么还需要0xEA来规定,难道版本更新了,还可以有标志来规定UTF8的标识bit是怎么一个组合?

但是0xEA和MMS的subject规范上的charset的值又怎么也对不上。于是到处查找UTF8的新规范,却怎么也找不到。

最后终于当我知道wsp协议有加0x80这个事情才恍然大悟,原来0xEA-0x80=0x6A,在IANA的MIB中注册的UTF8的charset就是106即0x6A,唉,不明白也不要乱写嘛。害人不浅

故此更新一篇blog,希望以后有人google的时候能google到我的这篇,不要再被误导了。

Copyright © 2025 Jerry Ren
Powered by .NET 9.0 on Kubernetes