windows记事本的编码格式ANSI,UNICODE BIG ENDIAN,UNICODE,UTF-8

  windows记事本保存格式  

  ANSI(American National Standards Institute ) 美国国家准学会

 

  ANSI

  和美国国家标准学会无关,也不是字符编码。在Windows系统不同语言环境下表示不同编码。Windows 里的「ANSI」其实是 Windows code pages,这个模式根据当前 locale(区域设置/语言环境) 选定具体的编码,比如简体中文 locale 下是 GBK。 

  UNICODE BIG ENDIAN

  带BOM的 UNICODE大端序UTF-16。大端序:数据的高位字节存放在地址的低端、低位字节存放在地址高端,即顺序存储。

  UNICODE

  带有 BOM(byte-order mark) 的小端序 UTF-16。BOM用于文本编辑器识别编码。

  UTF-8

  带 BOM 的 UTF-8

  注:Unicode是字符集(character set)、UTF-8、UTF-16、UTF-32是Unicode的编码(encoding)。目前不带 BOM 的 UTF-8兼容性最佳

  常用Unicode编码的BOM

UTF-8: EF BB BF
UTF-16 big endian: FE FF
UTF-16 little endian: FF FE
UTF-32 big endian: 00 00 FE FF
UTF-32 little endian: FF FE 00 00

 

 

 参考链接:

Using different language formats in Notepad

谈谈Unicode编码

字符编码笔记:ASCII,Unicode 和 UTF-8

ANSI是什么编码?

Windows 记事本的 ANSI、Unicode、UTF-8 这三种编码模式有什么区别?

Unicode码趣味科普

大端序与小端序

关于BOM

posted @ 2017-10-31 00:04  infocodez  阅读(494)  评论(0编辑  收藏  举报