字符编码

0.绪论

  字符编码是为了使得计算机能够使用二进制表示世界各国文字而产生的。因此,字符编码就是二进制与各国文字之间的对应关系。由于在计算机中最小的存储单位是1字节(8bit),因此一个文字对应的二进制一般都是整数个字节(1B、2B或者3B等)。

  字符编码是为了解决在计算机中表示各国文字产生的,那么不使用计算机的国家自然就没有这个烦恼。所以,字符编码的发展与计算机在各国的普及和发展有紧密联系。字符编码的发展阶段包括如下三个阶段:

  (1)由于计算机首先在美国出现,因此美国首先解决了英语的字符编码问题(ASCII码),使得计算机能够表示英语。

  (2)后来,随着计算机的不断发展,越来越多的国家开始使用计算机,于是各个国家和地区在ASCII码的基础上针对自己的文字进行了扩展,出现了很多字符编码,如中国大陆针对简体中文推出了GB2312、GBK编码,港澳台针对繁体中文推出了Big5编码,日本推出了JIS编码等等。尽管这些编码在各国内部都能正常使用,但是各个国家和地区推出的字符编码是互相不兼容的,因为同一个二进制数在不同的字符编码中代表的文字字符并不相同。

  (3)随着互联网的出现,全球的计算机都能够互相访问,因此必须有一个针对全球各国文字的统一字符编码才能保证全球范围的计算机之间的正常信息交换。于是,ISO(国际标准化组织)推出了Unicode字符集,它可以容纳世界上所有文字和符号。值得注意的是,Unicode字符集只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储,其具体的存储方式目前有UTF-8、UTF-16和UTF-32等多种存储实现。

1.常见字符编码

  参考:https://www.cnblogs.com/QQ931697811/p/3968033.html

  待补充

posted @ 2018-05-08 16:27  赵庆-BUPT  阅读(143)  评论(0编辑  收藏  举报