测试字符编码: ANSI, Unicode, Unicode Big Endian, UTF-8之区别
测试方法:
1. 使用notepad 编辑如下内容:
abc1234567890
2. 在存储时分别选取编码类型: ANSI, Unicode, Unicode Big Endian, UTF-8, 查看其文件长度;
3. 使用 cmd 下 debug 工具查看文件内容:
字符编码 |
存储空间长度 |
存储数据 |
分析 |
ANSI |
13 |
对应于原始文本二进制编码. |
|
Unicode |
28 |
以 FF FE 开头, 每一个字符占2个字节, 低8位为字符二进制编码, 高8位为0;汉字也占2个字节 |
|
Unicode Big Endian |
28 |
以FE FF开头, 每一个字符占2个字节,与Unicode顺序相反, 低8位为字符二进制编码, 高8位为0 ;汉字也占2个字节 |
|
UTF-8 |
16 |
以 EF BB BF 开头, 比原文本长度长 3个字节; 汉字也占3个字节 |
~做事情贵在坚持~