摘要: 前几天,Google给我Hotmail邮箱发了封确认信。我看不懂,不是因为我英文不行,而是"???? ????? ??? ????"的内容让我不知所措。有好多程序员处理不好编码问题。不是因为他们学不会,而是因为他们太保守或太不以为然了!我想说,初级程序员需要积累更多 的计算机高级知识;高级程序员需要了解更多的底层知识。 那么Content-Type标记到底有什么作用?UTF-8与Unicode到底有何关系?…………现在我们就一起来揭开编码那神奇的面纱!从ASCII编码谈起: 我们需要了解的最早编码是ASCII码。它用7个二进制位来表示,由于那个 时期生产的大多数计算机使用8 阅读全文
posted @ 2013-08-17 22:19 婷婷玉立的成长之家 阅读(460) 评论(0) 推荐(0) 编辑
摘要: 主题句:每个编码形式将字符从字符集转换为编码数据。 1 说白了一个代码点就是一个Unicode字符。代码单元就是代码点的集合。 2 字符视图 3 要了解字符集标准,您必须能区分三种不同的字符视图: 4 5 字符集(字符的抽象列表)。 6 作为带标量值的“代码点”的字符。 7 作为编码数据的字符。 8 字符集(字符的抽象列表) 9 10 字符集是各种文字(包括拉丁文、西里尔文、中文、朝鲜语、日语、希伯来语和阿拉伯语)中所包含的字符的一个抽象列表,由一百多万个字符组成。字符集还包括其他符号,例如音符。11 12 Unicode 和 GB18030 标准都具有字符集。当某个标准添加了新字符... 阅读全文
posted @ 2013-08-17 22:16 婷婷玉立的成长之家 阅读(448) 评论(0) 推荐(0) 编辑
摘要: 1、代码点&代码单元,是从Unicode标准而来的术语,Unicode标准的核心是一个编码字符集,它为每一个字符分配一个唯一数字。Unicode标准始终使用16进制数字,并且在书写时在前面加上U+,(看来U+代表Unicode标准哦。)如字符“A”的编码为“U+0041”。代码点是指可用于编码字符集的数字。编码字符集定义一个有效的代码点范围,但是并不一定将字符分配给所有这些代码点。有效的Unicode代码点范围是U+0000至U+10FFFF。Unicode4.0将字符分配给一百多万个代码点中的96382个代码点。说白了一个代码点就是一个Unicode字符。代码单元就是代码点的集合。字 阅读全文
posted @ 2013-08-17 22:08 婷婷玉立的成长之家 阅读(1245) 评论(0) 推荐(0) 编辑
摘要: What?如何分类?如何使用?//String 类提供处理 Unicode 代码点(即字符)(TT观点:指的莫非就是对象的意思。)和 Unicode 代码单元(即 char 值)的方法。(TT观点:看来处理这两种Unicode代码点和代码单元是不一样的,分开掌握。)1、toString() object类的toString方法。1 toString 2 3 public String toString() 4 5 返回该对象的字符串表示。通常,toString 方法会返回一个“以文本方式表示”此对象的字符串。结果应是一个简明但易于读懂的信息表达式。建议所有子类都重写此方法... 阅读全文
posted @ 2013-08-17 21:24 婷婷玉立的成长之家 阅读(588) 评论(0) 推荐(0) 编辑