字符编码
ASCII码
标准ASCII码
标准ASCII码占1个字节,使用其中的低7位,最高位用作奇偶校验。
扩展ASCII码
GBK码
ISO码
Unicode码
UTF-8占1~4个字节,UTF-16占2、4个字节,UTF-32占4个字节。
UTF-8
1、UTF-8编码预先定义了一套编码与字符对应的集,每个字符的编码具有唯一性。
2、识别连续的UTF编码字节如何表示字符,先判断第一个字节,如果是以0开头,则这个字符是用一个字节表示。如果是1开头,连续n个1表示这个字符占n个字节,第一个字节以连续n个1和1个0开头,后续n-1个字节以10开头。
UTF-8字节流(二进制) |
0xxxxxxx |
110xxxxx 10xxxxxx |
1110xxxx 10xxxxxx 10xxxxxx |
11110xxx 10xxxxxx 10xxxxxx 10xxxxxx |
3、ASCII码是UTF-8的子集。