摘要: unicode 统一的一种编码,它包括ucs-2,ucs-4ucs 通用字符集ucs-2 两个字节编码,是常见的unicode编码ucs-4 四个字节编码window 文本的unicode是little endian 低位开头对于英文来说,直接用unicode来储存是非常浪费空间和不利于传输,所以就出现了UTF-8,UTF-8是unicode和一种实现方式,只是它的储存方式有所不同,它每个字节都有个头标记,如0XXX XXXX开头就表示一个字节为一个unicode编码,110X XXXX 10XX XXXX两个字节为一个unicode编码,UTF-16多出的部分是ucs-2还是ucs-4??1 阅读全文
posted @ 2012-11-16 21:17 wahgon 阅读(302) 评论(0) 推荐(0) 编辑