摘要: UTF-8是unicode的一种实现方式,其他还有UTF-16等。Unicode作为一种通用字符集,包含了全世界所有字符,每个字符一个独立的编码。汉字的unicode编码表可以在此处查询:http://www.chi2ko.com/tool/CJK.htmUTF-8是一种变长的编码方式,长度从1到6不等。从字符第1个字节就能知道该字符占几个字节。比如"中",UTF-8编码是%E4%B8%AD,显然是在e0-ef范围内,表明其占用3个字节。汉字基本都是3个字节。中文输入状态下的符号,比如间隔号”·“,其编码是%C2%B7,在c0-df范围之间,则表示其占2个字节。下 阅读全文
posted @ 2012-05-26 15:40 我的白日梦 阅读(2705) 评论(0) 推荐(0) 编辑