摘要: UTF为了解决Unicode下的ANSI符号的空间浪费和网络传输下如何截取字符的问题给出了解决方案: 规定如果一个符号只占一个字节,那么这个8位字节的第一位就为0。如果为两个字节,那么规定第一个字节的前两位都为1,然后第一个字节的第三位为0,第二个字节的前两位为10,然后如果是三个字节的话,那么第一 阅读全文
posted @ 2017-06-12 17:37 IFearless 阅读(979) 评论(0) 推荐(0) 编辑
摘要: 首先明确“字节(Byte)”和“字符(Character)”的大小: 1 byte = 8 bit 1 char = 2 byte = 16 bit (Java默认UTF-16编码) 虽然1 bit才是数据真正的最小单位,但1 bit 的信息量太少了。要表示一个有用的信息,需要好几个bit一起表示。 阅读全文
posted @ 2017-06-12 17:00 IFearless 阅读(237) 评论(0) 推荐(0) 编辑
摘要: 作者 许令波 作者 许令波 作者 许令波 几种常见的编码格式 为什么要编码 不知道大家有没有想过一个问题,那就是为什么要编码?我们能不能不编码?要回答这个问题必须要回到计算机是如何表示我们人类能够理解的符号的,这些符号也就是我们人类使用的语言。由于人类的语言有太多,因而表示这些语言的符号太多,无法用 阅读全文
posted @ 2017-06-12 16:15 IFearless 阅读(81) 评论(0) 推荐(0) 编辑
摘要: 作者: 阮一峰 今天中午,我突然想搞清楚Unicode和UTF-8之间的关系,于是就开始在网上查资料。 结果,这个问题比我想象的复杂,从午饭后一直看到晚上9点,才算初步搞清楚。 下面就是我的笔记,主要用来整理自己的思路。但是,我尽量试图写得通俗易懂,希望能对其他朋友有用。毕竟,字符编码是计算机技术的 阅读全文
posted @ 2017-06-12 16:11 IFearless 阅读(67) 评论(0) 推荐(0) 编辑