编码

编码表:其实就是生活中字符和计算机二进制的对应关系表。
1、ASCII:一个字节中的 7 位就可以表示。对应的字节都是正数。0-xxxxxxx
2、ISO-8859-1:拉丁码表 latin,用了一个字节 8 位。1-xxxxxxx 负数。
3、GB2312:简体中文码表。包含 6000-7000 中文和符号。用两个字节表示。两个字节第一个字
节是负数,第二个字节可能是正数
4、GBK:目前最常用的中文码表,2 万的中文和符号。用两个字节表示,其中的一部分文字,第一个字节开头是 1,第二字节开头是 0
5、 GB18030:最新的中文码表
6、unicode:国际标准码表:无论是什么文字,都用两个字节存储。
 Java 中的 char 类型用的就是这个码表。char c = 'a';占两个字节。
 Java 中的字符串是按照系统默认码表来解析的。简体中文版 字符串默认的码表是 GBK。
7、UTF-8:基于 unicode,一个字节就可以存储数据,不要用两个字节存储,而且这个码表更加的标准化,在每一个字节头加入了编码信息(后期到 api 中查找)。
能识别中文的码表:GBK、UTF-8;正因为识别中文码表不唯一,涉及到了编码解码问题。
对于我们开发而言;常见的编码 GBK UTF-8 ISO-8859-1
文字--->(数字) :编码。 “abc”.getBytes() byte[]
(数字)--->文字:解码。 byte[] b={97,98,99} new String(b)

posted @ 2018-12-02 20:51  FanYiZhan  阅读(207)  评论(0编辑  收藏  举报