由谈退格键的实现来学习字符编码
摘要:
我曾以为老师的话是真的,我曾以为老师会为自己说出的话负责,但事实证明很多时候是照本宣科。 这次在公司做Fcitx输入法时,想到退格删除的字节数的不同,即退格键一按到底删除的是一个字节还是两个字节或者多个。在测试中我发现,中文汉字占了三个字节,竟然占了三个字节,老师不是经常告诉我们汉字是占两个字节,但现在怎么占了三个字节,是老师的错还是程序的错,亦或本都没错,只是没有探其根本罢了。 说汉字占两个字节是从以Unicode的编码方式UCS-2来说的,但实际占三个字节,是从Unicode的实现方式UTF-8来说的。 先介绍下Unicode字符集吧。 什么是字符?什么是字符集? 字符是各种... 阅读全文
posted @ 2012-06-23 14:56 深圳彦祖 阅读(1178) 评论(0) 推荐(0) 编辑