常见的字符集

常见的码表如下:

       ASCII 美国标准信息交换码。用一个字节的7位可以表示。

       ISO8859-1 拉丁码表。欧洲码表,用一个字节的8位表示。又称Latin-1(拉丁编码)西欧语言ASCII码是包含的仅仅是英文字母,并且没有完全占满256个编码位  置,所以它以ASCII为基础,在空置的0xA0-0xFF的范围内,加入192个字母及符号,藉以供使用变音符号的拉丁字母语言使用。从而支持德文,法文等。因而它依然是一个单字节编码,只是比ASCII更全面。

      GB2312 中国的中文编码表。

      GBK 中国的中文编码表升级,融合了更多的中文文字符号。

      Unicode: 国际标准码,融合了多种文字。所有文字都用两个字节来表示,Java语言使用的就是unicode

      UTF-8 最多用三个字节来表示一个字符。

      ISO8859-1:一个字节

      GBK: 两个字节包含了英文字符和扩展的中文 ISO8859-1+中文字符

      UTF-8 万国码,推行的。是1~3个字节不等长。英文存的是1个字节,中文存的是3个字节,是为了节省空间。

 

posted @ 2016-11-06 16:47  Warekiller  阅读(211)  评论(0编辑  收藏  举报