测试字符编码: ANSI, Unicode, Unicode Big Endian, UTF-8之区别

测试方法:

1. 使用notepad 编辑如下内容:

abc1234567890

2. 在存储时分别选取编码类型: ANSI, Unicode, Unicode Big Endian, UTF-8, 查看其文件长度;

3. 使用 cmd debug 工具查看文件内容:

 

 

 

字符编码

存储空间长度

存储数据

分析

ANSI

13

对应于原始文本二进制编码.

Unicode

28

FF FE 开头, 每一个字符占2个字节, 8位为字符二进制编码, 8位为0;汉字也占2个字节

Unicode Big Endian

28

FE FF开头, 每一个字符占2个字节,Unicode顺序相反, 8位为字符二进制编码, 8位为0 ;汉字也占2个字节

UTF-8

16

EF BB BF 开头, 比原文本长度长 3个字节; 汉字也占3个字节

posted @ 2011-10-07 21:07  沧海小小粟  阅读(2146)  评论(0编辑  收藏  举报