C#学习笔记之编码
归纳:
一、ASCII码
ASCII码是用来表示英文字符的一种编规范,每个ASCII字符占用1个字节,因此,ASCII编码可以表示的最大字符数为255(00H-FFH)。
二、Unicode码
Unicode也是一种字符编码方法,它占用两个字节(0000H-FFFFH),容纳65536个字符。
三、UTF-8
以8位为单元对Unicode进行编码,从Unicode到UTF-8的编码方式如下:
例如:“汉”字的Unicode编码是6C49。6C49在0800-FFFF之间,所以要用3字节模板:1110xxxx 10xxxxxx 10xxxxxx。将6C49写成二进制是:0110 110001 001001,用这个比特流依次代替模板中的x,得到:11100110 10110001 10001001,即E6 B1 89。
四、实例
1、 Encoding.ASCII与字符串
2、Encoding.Unicode与字符串
3、Encoding.BigEndianUnicode与字符串
4、Default与字符串
5、Encoding.UFT32与字符串
6、Encoding.UFT7与字符串
7、Encoding.UFT8与字符串
8、Encoding.ASCII与中文
9、Encoding.Unicode与中文
10、Encoding.UTF-32与中文
11、Encoding.UTF-7与中文
12、Encoding.UTF-8与中文