字符编码知识:Unicode、UTF-8、ASCII、GB2312等编码之间是如何转换的?(附编码查询转换网站)
转自:http://hi.baidu.com/%BA%DA%C9%AB%B7%C0%D3%F9/blog/item/301d15102f7e78cca6ef3f3a.html
关于utf8,unicode的知识和概念总是查了忘,忘了查,上面这篇文章讲的简短透彻,故转载于此。
总结几点:
1. Unicode只是一个符号集,只是一种规范、标准,它只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储在计算机上。比如“严”字的unicode码是U+4E25
2. UTF8是Unicode的实现方式之一,它规定了字符如何在计算机中存储、传输等; UTF8是一种变长的编码方式;
另外文章中附了两个使用网址,用户查询编码转换十分方便:
1. http://bm.kdd.cc
2. http://www.nengcha.com/code/ascii/